On Intelligence
Jeff HAWKINS
Genèse de la génomique
Sujets apparentés
Séquençage des grands génomes, automne 1989
Antoine Danchin
Difficile de s'en souvenir après plusieurs décennies tant il est habituel de considérer que séquencer le génome des organismes vivants est une banalité, mais le début des projets de séquençage fut très laborieux. La majorité des acteurs pensait qu'on en savait déjà suffisamment, et qu'il n'y avait rien de plus à découvrir. Au surplus ces projets coûtaient à l'époque une fortune (séquencer 50 kilobases d'un génome demandait le travail d'au moins une personne hautement qualifiée à temps plein pendant une année). Justifier conceptuellement ces projets était donc essentiel. André Goffeau, au Directorat de la Recherche de la Commission Européenne (DG XII), était convaincu de l'importance des projets de séquençage génomique, et pour faire pendant au séquençage du génome humain il décida de développer en Europe celui du génome de la levure. C'est dans ce contexte que nous avons dû faire le tour des agences de recherche gouvernementales pour justifier l'intérêt de ces projets. Un argument central était qu'au delà des approches expérimentales classiques, in vivo et in vitro, un rôle nouveau des ordinateurs se développait, mettant en œuvre des expériences d'un type spécifique, pour lesquelles nous avions proposé dans nos discussions avec la DG XII le terme "in silico" – André Goffeau préférait "in silicio", en raison du nom de l'élément silicium, alors que nous avions choisi le c dur de "silicates", "silicones" etc. C'est in silico qui a prévalu, consacré plus tard (en 1995) au cours de la réunion de Dormy House.
Invité par la DG XII pour le programme Biology Action Programme (BAP), comme observateur au meeting consacré au séquençage d'un chromosome de la levure, j'ai souligné lors d'une réunion à Tutzing l'importance de l'usage des ordinateurs pour la recherche sur les génomes, et proposé le concept d'expérimentation "in silico" :
La première publication scientifique dans un journal à comité de lecture international où apparaît l'expression "in silico" est le compte-rendu d'une conférence internationale sur le génome de Bacillus subtilis tenue à l'Institut Pasteur du 2 au 5 septembre 1990 :
A Danchin, C Médigue, O Gascuel, H Soldano, A
Hénaut
From data banks to data bases
[Keywords: Data bank, Data base, Library,
B. subtilis, E. coli, Nucleotide and protein
sequences, Updating, Learning techniques, In silico.]
This paper summarizes a conference given at the
beginning of the summer of 1990 on the biology of Bacillus
subtilis and its genome program
[Abstract: The
information collected in national and international libraries on
nucleotide and protein sequences cannot be directly treated for
proper handling by existing software. Therefore we evaluated the
feasibility of constructing a data base for Escherichia coli
using the data present in the banks. The know how thus acquired was
applied to Bacillus subtilis. Specific examples of the
general procedure are given]
Research in Microbiology (1991) 142: 913-916
Auparavant, le résumé présenté ici (imprimé avec une imprimante à aiguilles, comme on le remarque dans la ligne de formattage) a servi d'introduction à plusieurs conférences durant l'été et l'automne 1990 (en particulier à Seillac à une réunion organisée par l'INSERM) :
G----I----!---------!---------!---------!---------!---------!---------!---------!--D
#F62,00,00,00,03,01,40,02,01,01,08,00,80,00,00,00,00,01,05,#
Faire parler la cohérence interne des génomes
L'autonomie des systèmes vivants résulte de la cohérence interne de leur programme génétique. Les règles spécifiées par la séquence de l'ADN décident de la survie et de la reproduction de tous les organismes. Or cela correspond à un programme de longueur finie. Toutes les règles de réécriture qui interprètent le programme génétique (transcription et traduction) et fixent la structure de tous les effecteurs du métabolisme sont totalement incluses dans les séquences correspondantes des acides nucléiques et des protéines (éventuellement à la suite des relations entre plusieurs des objets correspondants). Jusqu'à présent, l'aspect cohérent des génomes est resté inaccessible, mais les nouvelles techniques de séquençage vont permettre de mettre au jour beaucoup des contraintes dues à cette cohérence. Un génome est le résultat d'une histoire, il n'est pas le fruit d'un simple hasard. Il est donc raisonnable d'espèrer découvrir des règles de construction, à la fois à partir de l'étude d'un seul génome et à partir de la comparaison des génomes entre eux. Le problème posé n'est pas sans rappeler celui du décryptage de langues disparues, du moins de celles pour lesquelles il existe une pierre de Rosette, car, dans notre cas, le retour à l'expérience est toujours possible. Du point de vue informatique, on se trouve donc confronté à la création de base de données évolutives où l'on devra reconnaître des traits pertinents à la suite d'apprentissages. La création de descripteurs, la genèse d'hypothèses exploratoires permettra d'ajouter aux traditionnelles méthodes de la biologie, in vivo et in vitro, l'expérimentation "in silico". Quelques exemples de projets seront présentés.
Une brève histoire de la bioinformatique en France est présentée ici en anglais, mais sous forme édulcorée :
A Danchin
A brief history of genome research and bioinformatics in France
Bioinformatics (2000) 16: 65-75
voir aussi un hommage à Hiroshi Yoshikawa et à Frank Kunst