Lancer "install.sh" pour compiler le programme "distances" et les utilitaires (issus de la suite "phylip") nécessaires à la représentation de l'arbre. Les binaires "distances" et "drawtree" sont alors disponibles dans le même répertoire. Pour fonctionner, le script "calcul.sh" a besoin de ces deux binaires ainsi que de "fontfile" (également installé par "install.sh").

Le script "calcul.sh" doit être lancé sur un répertoire contenant les fichiers à traiter au format texte simple. On peut décider si on souhaite tenir compte des abréviations et des variantes graphiques (voir les substitutions proposées dans les "filtres" 1, 2, 3, 4, à modifier en fonction des besoins). Les fichiers de transcription sont copiés et homogénéisés chacun sous son nom dans le répertoire temporaire TMPMS (détruit à la fin du processus). Le programme "distances" sélectionne ensuite deux à deux les fichiers de TMPMS pour calculer leur distance, stockée dans une matrice, puis lance l'algorithme "neighbor-joining": lorsque tous les calculs sont achevés, il écrit le fichier "intree", qui énumère les distances (simple possibilité de contrôle) et propose, à la fin, une description des embranchements entre parenthèses. Ce fichier peut alors être traité par "drawtree" pour éditer un arbre au format postscript.

***
Dans les fichiers de transcription, on peut également insérer des remarques entre crochets droits (tout ce qui se trouve entre "[" et "]" est supprimé lors de l'homogénéisation des fichiers. D'autres abréviations ou caractéristiques graphiques peuvent être codées:

     - "@" correspond au e cédille et sera interprété comme très proche de "ae".
     - "-" marque une nasale
     - "^" peut être utilisé pour marquer une insistance liée à la mise en page (majuscule ornée par exemple); le signe sera légèrement pris en compte (valeur d'1/8 de lettre).
     - "p-" = "prae"
     - "p_" = "per"
     - "p|" = "pro"
     - "2" = "ur"
     - "'" = "us"
     - "q+" = "que"
     - "b+" = "bus"
     - "&" = "et"
     - "q`" = "qui"
     - "q°" = "quo"
     - "c- " = "cum"
     - "c-" = "con"
     - "qm-" = "quoniam"
     - "au-" = "aut-" = "autem"
     - "s-" = "sunt"
     - "t-c" = "tunc"
     - "n-c" = "nunc"
     - " %" = " est"
     - " e- " = " est "
     - "r%" = "rum"
     - "r-t" = "runt"
     - "o=i" = "omni"
     - "e=e" = "esse"
     - "q<" = "quia"
     - "7" = "et"
     - "7-" = "etiam"
     - "9" = "con"
     - "u°" = "uero"
     - Toute autre abréviation peut être encodée dans les fonctions "filtre" du programme "calcul".

En l'état, le programme ne permet pas l'emploi des chiffres romains; la ponctuation peut être transcrite, mais ne sera pas prise en compte (on peut toutefois considérer que le caractère "^", éventuellement reproduit à plusieurs reprises en fonction du poids qu'on veut lui donner, peut correspondre à une indication de ce type).

Un caractère effacé ou illisible peut être codé par "*" ou "/": dans ce cas, il entraîne une demi-distance par rapport à n'importe quel caractère, y compris lui-même. L'emploi de "0" force une distance nulle par rapport à n'importe quel caractère (à utiliser avec prudence et parcimonie...).

De manière plus générale, tout signe non alphabétique différent de "*", "/", "#", "@", "^", "_" ou "0" est assimilé à une coupure de mot.

Dans le cas où les manuscrits ne coupent pas tous les mots de la même manière, on peut utiliser le caractère "_" pour marquer l'espace et éviter d'accroître la distance: ainsi "utcumque res" face à "ut_cum_que res" sera interprété comme une distance de 2, tandis que "utcumque res" face à "ut cum que res" donnera 10.

Le programme n'est pas sensible aux sauts de lignes; si on veut marquer la coupure d'un mot en fin de ligne, il convient d'utiliser le signe "~": le script "calcul" restitue ainsi le mot dans son intégralité.

Voir les transcriptions proposées dans le répertoire "EXEMPLE".

***
Pour lancer le programme, il suffit de taper:

./calcul EXEMPLE

(ou tout autre nom de répertoire).