#!/bin/zsh

function filtre1()
{
for i in `ls TMPMS`; do
sed "s/ae/e/g; s/oe/e/g;
s/dc/cc/g; s/df/ff/g; s/dg/gg/g; s/dl/ll/g; s/dm/mm/g; s/dn/nn/g; s/dp/pp/g; s/dr/rr/g; s/ds/ss/g; s/dt/tt/g; s/nm/mm/g; s/nb/mb/g; s/np/nm/g; s/nr/rr/g; s/bp/pp/g; s/cq/dq/g; 
s/y/i/g; ; s/ph/f/g; s/h//g;
s/tia/cia/g; s/tie/cie/g; s/tii/cii/g; s/tio/cio/g; s/tiu/ciu/g" TMPMS/$i |cat > TMPMS/$i.bis
rm -Rf TMPMS/$i
mv TMPMS/$i.bis TMPMS/$i
done
}

function filtre2()
{
for i in `ls TMPMS`; do
sed "s/ae/æ/g" TMPMS/$i |cat > TMPMS/$i.bis
rm -Rf TMPMS/$i
mv TMPMS/$i.bis TMPMS/$i
done
}

cp -R $1 ./TMPMS
echo -e "\n Le programme établit des « coûts » de substitution différents en fonction des caractères comparés; ainsi, le remplacement d'un « n » par un « m » ne « coûte » pas aussi cher que le remplacement, par exemple, d'un « m » par un « r » (voir le code de « distances.ml » pour obtenir la table des substitutions). Par ailleurs, si vous ne souhaitez pas développer l'abréviation des nasales, vous pouvez utiliser « - » pour transcrire l'abréviation (ainsi « u- » sera traité comme très proche de « um » et de « un »). \nIl est toutefois possible de supprimer l'essentiel des variantes graphiques. \nVoulez-vous calculer la distance \n\t 1. en minimisant les variantes graphiques ?\n\t 2. en tenant compte des variantes graphiques ?"
read reponse
echo -e "\n\nDans quel fichier voulez-vous exporter l'arbre (format ps)?"
read fichier

if [[ $reponse == "1" ]]
then
    filtre1
elif [[ $reponse == "2" ]]
then
    filtre2
fi
echo -e "\nCalcul de la matrice des distances sur l'ensemble des textes que vous avez fournis. S'il y en a plus de 15, allez prendre un café...\n"
./distances TMPMS/*|sed "s/TMPMS\///g"|cat > intree
./drawtree

rm -Rf TMPMS
mv plotfile $fichier
gv $fichier
