On Intelligence
Jeff HAWKINS
Genèse de la génomique
Sujets apparentés
Séquençage des grands génomes, automne 1989
Antoine Danchin
Il est difficile de s'en souvenir plus de vingt ans après tant il est habituel de considérer que séquencer le génome des organismes vivants est une banalité, mais le début des projets de séquençage fut très laborieux. La majorité des acteurs pensait qu'on en savait déjà suffisamment, et qu'il n'y avait rien de plus à découvrir. Au surplus ces projets coûtaient à l'époque une fortune (séquencer 50 kilobases d'un génome demandait le travail d'au moins une personne hautement qualifiée à temps plein pendant une année). Dans ces conditions, la justification conceptuelle des projets jouait un rôle important. André Goffeau, qui travaillait au Directorat de la Recherche de la Commission Européenne était convaincu de l'importance des projets de séquençage génomique, et pour faire pendant au séquençage du génome humain il décida de favoriser celui du génome de la levure. C'est dans ces conditions que nous avons dû faire le tour des agences de recherche gouvernementales pour motiver l'intérêt de ces projets. Un argument central était qu'au delà des approches expérimentales classiques, in vivo et in vitro, un rôle nouveau des ordinateurs se développait, pour lequel on pouvait parler d'expériences d'un type spécifique, pour lesquelles nous avions proposé dans nos discussions avec le Directorat de la Recherche de la Commission Européenne le terme "in silico" – André Goffeau préférait "in silicio", en raison du nom de l'élément silicium, alors que nous avions choisi le c dur de "silicates", "silicones" etc; c'est in silico qui a prévalu, consacré plus tard (en 1995) au cours de la réunion de Dormy House – pour mettre en évidence ce rôle.
Invité par le Directorat Général de la Recherche à la Commission Européenne pour le programme Biology Action Programme (BAP), en tant qu'observateur au meeting consacré au séquençage d'un chromosome de la levure, j'ai souligné lors d'une réunion à Tutzing l'importance de l'usage des ordinateurs pour la recherche sur les génomes, et proposé le concept d'expérimentation "in silico" :
La première publication scientifique dans un journal à comité de lecture international où apparaît l'expression "in silico" est la suivante. Elle correspond au compte-rendu d'une conférence internationale sur le génome de Bacillus subtilis tenue à l'Institut Pasteur du 2 au 5 septembre 1990 :
A Danchin, C Médigue, O Gascuel, H Soldano, A
Hénaut
From data banks to data bases
[Keywords: Data bank, Data base, Library,
B. subtilis, E. coli, Nucleotide and protein
sequences, Updating, Learning techniques, In silico.]
This paper summarizes a conference given at the
beginning of the summer of 1990 on the biology of Bacillus
subtilis and its genome program
[Abstract: The
information collected in national and international libraries on
nucleotide and protein sequences cannot be directly treated for
proper handling by existing software. Therefore we evaluated the
feasibility of constructing a data base for Escherichia coli
using the data present in the banks. The knowhow thus acquired was
applied to Bacillus subtilis. Specific examples of the
general procedure are given]
Research in Microbiology (1991) 142: 913-916
Auparavant, le résumé présenté ici a servi d'introduction à plusieurs conférences durant l'été et l'automne 1990 (en particulier à Seillac à une réunion organisée par l'INSERM) :
G----I----!---------!---------!---------!---------!---------!---------!---------!--D
#F62,00,00,00,03,01,40,02,01,01,08,00,80,00,00,00,00,01,05,#
Faire parler la cohérence interne des génomes
L'autonomie des systèmes vivants résulte de la cohérence interne de leur programme génétique. Les règles spécifiées par la séquence de l'ADN décident de la survie et de la reproduction de tous les organismes. Or cela correspond à un programme de longueur finie. Toutes les règles de réécriture qui interprètent le programme génétique (transcription et traduction) et fixent la structure de tous les effecteurs du métabolisme sont totalement incluses dans les séquences correspondantes des acides nucléiques et des protéines (éventuellement à la suite des relations entre plusieurs des objets correspondants). Jusqu'à présent, l'aspect cohérent des génomes est resté inaccessible, mais les nouvelles techniques de séquençage vont permettre de mettre au jour beaucoup des contraintes dues à cette cohérence. Un génome est le résultat d'une histoire, il n'est pas le fruit d'un simple hasard. Il est donc raisonnable d'espèrer découvrir des règles de construction, à la fois à partir de l'étude d'un seul génome et à partir de la comparaison des génomes entre eux. Le problème posé n'est pas sans rappeler celui du décryptage de langues disparues, du moins de celles pour lesquelles il existe une pierre de Rosette, car, dans notre cas, le retour à l'expérience est toujours possible. Du point de vue informatique, on se trouve donc confronté à la création de base de données évolutives où l'on devra reconnaître des traits pertinents à la suite d'apprentissages. La création de descripteurs, la genèse d'hypothèses exploratoires permettra d'ajouter aux traditionnelles méthodes de la biologie, in vivo et in vitro, l'expérimentation "in silico". Quelques exemples de projets seront présentés.
Une brève histoire de la bioinformatique en France est présentée ici en anglais sous forme édulcorée :
A Danchin
A brief history of genome research and bioinformatics in France
Bioinformatics (2000) 16: 65-75
voir aussi un hommage à Hiroshi Yoshikawa et à Frank Kunst