Lancer "install.sh" pour compiler le programme "distances" et les utilitaires (issus de la suite "phylip") nécessaires à la représentation de l'arbre. Les binaires "distances" et "drawtree" sont alors disponibles dans le même répertoire. Pour fonctionner, le script "calcul.sh" a besoin de ces deux binaires ainsi que de "fontfile" (également installé par "install.sh").

Le script "calcul.sh" doit être lancé sur un répertoire contenant les fichiers à traiter au format texte simple. On peut décider si on souhaite tenir compte des abréviations et des variantes graphiques (voir les substitutions proposées dans les "filtres" 1, 2, 3, 4, à modifier en fonction des besoins). Les fichiers de transcription sont copiés et homogénéisés chacun sous son nom dans le répertoire temporaire TMPMS (détruit à la fin du processus). Le programme "distances" sélectionne ensuite deux à deux les fichiers de TMPMS pour calculer leur distance, stockée dans une matrice (exportée au format nexus), puis lance l'algorithme "neighbor-joining": lorsque tous les calculs sont achevés, il écrit le fichier "intree", qui propose une description des embranchements entre parenthèses. Ce fichier peut alors être traité par "drawtree" pour éditer un arbre au format postscript. La matrice des distances, au format nexus, peut être utilisée avec d'autres logiciels de phylogénie.

***
Dans les fichiers de transcription, on peut également insérer des remarques entre crochets droits (tout ce qui se trouve entre "[" et "]" est supprimé lors de l'homogénéisation des fichiers. D'autres abréviations ou caractéristiques graphiques peuvent être codées:

     - "@" correspond au e cédille et sera interprété comme très proche de "ae".
     - "-" marque une nasale
     - "^" peut être utilisé pour marquer une insistance liée à la mise en page (majuscule ornée par exemple); le signe sera légèrement pris en compte (valeur d'1/8 de lettre).
     - "p-" = "prae"
     - "p_" = "per"
     - "p|" = "pro"
     - "2" = "ur"
     - "'" = "us"
     - "q+" = "que"
     - "b+" = "bus"
     - "&" = "et"
     - "q`" = "qui"
     - "q°" = "quo"
     - "c- " = "cum"
     - "c-" = "con"
     - "qm-" = "quoniam"
     - "au-" = "aut-" = "autem"
     - "s-" = "sunt"
     - "t-c" = "tunc"
     - "n-c" = "nunc"
     - " %" = " est"
     - " e- " = " est "
     - "r%" = "rum"
     - "r-t" = "runt"
     - "o=i" = "omni"
     - "e=e" = "esse"
     - "q<" = "quia"
     - "7" = "et"
     - "7-" = "etiam"
     - "9" = "con"
     - "u°" = "uero"
     - Toute autre abréviation peut être encodée dans les fonctions "filtre" du programme "calcul".

En l'état, le programme ne permet pas l'emploi des chiffres romains; la ponctuation peut être transcrite, mais ne sera pas prise en compte (on peut toutefois considérer que le caractère "^", éventuellement reproduit à plusieurs reprises en fonction du poids qu'on veut lui donner, peut correspondre à une indication de ce type).

Un caractère effacé ou illisible peut être codé par "*" ou "/": dans ce cas, il entraîne une demi-distance par rapport à n'importe quel caractère, y compris lui-même. L'emploi de "0" force une distance nulle par rapport à n'importe quel caractère (à utiliser avec prudence et parcimonie...).

De manière plus générale, tout signe non alphabétique différent de "*", "/", "#", "@", "^", "_" ou "0" est assimilé à une coupure de mot.

Dans le cas où les manuscrits ne coupent pas tous les mots de la même manière, on peut utiliser le caractère "_" pour marquer l'espace et éviter d'accroître la distance: ainsi "utcumque res" face à "ut_cum_que res" sera interprété comme une distance de 2, tandis que "utcumque res" face à "ut cum que res" donnera 10.

Le programme n'est pas sensible aux sauts de lignes; si on veut marquer la coupure d'un mot en fin de ligne, il convient d'utiliser le signe "~": le script "calcul" restitue ainsi le mot dans son intégralité.

Voir les transcriptions proposées dans le répertoire "EXEMPLE".

***
Pour lancer le programme, il suffit de taper:

./calcul EXEMPLE

(ou tout autre nom de répertoire).