Lancer "install.sh" pour compiler le programme "distances" et les utilitaires (issus de la suite "phylip") nécessaires à la représentation de l'arbre. Les binaires "distances" et "drawtree" sont alors disponibles dans le même répertoire. Pour fonctionner, le script "calcul.sh" a besoin de ces deux binaires ainsi que de "fontfile" (également installé par "install.sh"). Le script "calcul.sh" doit être lancé sur un répertoire contenant les fichiers à traiter au format texte simple. On peut décider si on souhaite tenir compte des abréviations et des variantes graphiques (voir les substitutions proposées dans les "filtres" 1, 2, 3, 4, à modifier en fonction des besoins). Les fichiers de transcription sont copiés et homogénéisés chacun sous son nom dans le répertoire temporaire TMPMS (détruit à la fin du processus). Le programme "distances" sélectionne ensuite deux à deux les fichiers de TMPMS pour calculer leur distance, stockée dans une matrice, puis lance l'algorithme "neighbor-joining": lorsque tous les calculs sont achevés, il écrit le fichier "intree", qui énumère les distances (simple possibilité de contrôle) et propose, à la fin, une description des embranchements entre parenthèses. Ce fichier peut alors être traité par "drawtree" pour éditer un arbre au format postscript. *** Dans les fichiers de transcription, on peut également insérer des remarques entre crochets droits (tout ce qui se trouve entre "[" et "]" est supprimé lors de l'homogénéisation des fichiers. D'autres abréviations ou caractéristiques graphiques peuvent être codées: - "@" correspond au e cédille et sera interprété comme très proche de "ae". - "-" marque une nasale - "^" peut être utilisé pour marquer une insistance liée à la mise en page (majuscule ornée par exemple); le signe sera légèrement pris en compte (valeur d'1/8 de lettre). - "p-" = "prae" - "p_" = "per" - "p|" = "pro" - "2" = "ur" - "'" = "us" - "q+" = "que" - "b+" = "bus" - "&" = "et" - "q`" = "qui" - "q°" = "quo" - "c- " = "cum" - "c-" = "con" - "qm-" = "quoniam" - "au-" = "aut-" = "autem" - "s-" = "sunt" - "t-c" = "tunc" - "n-c" = "nunc" - " %" = " est" - " e- " = " est " - "r%" = "rum" - "r-t" = "runt" - "o=i" = "omni" - "e=e" = "esse" - "q<" = "quia" - "7" = "et" - "7-" = "etiam" - "9" = "con" - "u°" = "uero" - Toute autre abréviation peut être encodée dans les fonctions "filtre" du programme "calcul". En l'état, le programme ne permet pas l'emploi des chiffres romains; la ponctuation peut être transcrite, mais ne sera pas prise en compte (on peut toutefois considérer que le caractère "^", éventuellement reproduit à plusieurs reprises en fonction du poids qu'on veut lui donner, peut correspondre à une indication de ce type). Un caractère effacé ou illisible peut être codé par "*" ou "/": dans ce cas, il entraîne une demi-distance par rapport à n'importe quel caractère, y compris lui-même. L'emploi de "0" force une distance nulle par rapport à n'importe quel caractère (à utiliser avec prudence et parcimonie...). De manière plus générale, tout signe non alphabétique différent de "*", "/", "#", "@", "^", "_" ou "0" est assimilé à une coupure de mot. Dans le cas où les manuscrits ne coupent pas tous les mots de la même manière, on peut utiliser le caractère "_" pour marquer l'espace et éviter d'accroître la distance: ainsi "utcumque res" face à "ut_cum_que res" sera interprété comme une distance de 2, tandis que "utcumque res" face à "ut cum que res" donnera 10. Le programme n'est pas sensible aux sauts de lignes; si on veut marquer la coupure d'un mot en fin de ligne, il convient d'utiliser le signe "~": le script "calcul" restitue ainsi le mot dans son intégralité. Voir les transcriptions proposées dans le répertoire "EXEMPLE". *** Pour lancer le programme, il suffit de taper: ./calcul EXEMPLE (ou tout autre nom de répertoire).