computer
All objects in your world are composed of subobjects that occur consistently together; that is the very definition of an object. When we assign a name to something, we do so because a set of features consistently travels together

On Intelligence
Jeff HAWKINS


Genèse de la génomique

Genèse de la génomique
Pioneering computational genomics (en anglais)

in silico (in english)

Pioneering genome studies (en anglais)
Bases de données

Sujets apparentés

Origine de la vie
Le démon de Maxwell
Biologie Symplectique

Séquençage des grands génomes, automne 1989

Difficile de s'en souvenir après plusieurs décennies tant il est habituel de considérer que séquencer le génome des organismes vivants est une banalité, mais le début des projets de séquençage fut très laborieux. La majorité des acteurs pensait qu'on en savait déjà suffisamment, et qu'il n'y avait rien de plus à découvrir. Au surplus ces projets coûtaient à l'époque une fortune (séquencer 50 kilobases d'un génome demandait le travail d'au moins une personne hautement qualifiée à temps plein pendant une année). Justifier conceptuellement ces projets était donc essentiel. André Goffeau, au Directorat de la Recherche de la Commission Européenne (DG XII), était convaincu de l'importance des projets de séquençage génomique, et pour faire pendant au séquençage du génome humain il décida de développer en Europe celui du génome de la levure. C'est dans ce contexte que nous avons dû faire le tour des agences de recherche gouvernementales pour justifier l'intérêt de ces projets. Un argument central était qu'au delà des approches expérimentales classiques, in vivo et in vitro, un rôle nouveau des ordinateurs se développait, mettant en œuvre des expériences d'un type spécifique, pour lesquelles nous avions proposé dans nos discussions avec la DG XII le terme "in silico" – André Goffeau préférait "in silicio", en raison du nom de l'élément silicium, alors que nous avions choisi le c dur de "silicates", "silicones" etc. C'est in silico qui a prévalu, consacré plus tard (en 1995) au cours de la réunion de Dormy House.

Invité par la DG XII pour le programme Biology Action Programme (BAP), comme observateur au meeting consacré au séquençage d'un chromosome de la levure,  j'ai souligné lors d'une réunion à Tutzing l'importance de l'usage des ordinateurs pour la recherche sur les génomes, et proposé le concept d'expérimentation "in silico" :

From the information technologies perspective, we are faced with the need to create databases where we will recognize relevant features in response to learning processes. The creation of descriptors, the genesis of exploratory hypotheses will add to the traditional methods of biology, in vivo and in vitro, experiments "in silico." Some examples of projects were presented, in the domain of protein secretion.
BAP Meeting on Sequencing of the Yeast Chromosome III (october 31st - november 2nd, 1989, Tutzing, Germany)

La première publication scientifique dans un journal à comité de lecture international où apparaît l'expression "in silico"  est le compte-rendu d'une conférence internationale sur le génome de Bacillus subtilis tenue à l'Institut Pasteur du 2 au 5 septembre 1990 :

A Danchin, C Médigue, O Gascuel, H Soldano, A Hénaut
From data banks to data bases
[Keywords: Data bank, Data base, Library, B. subtilis, E. coli, Nucleotide and protein sequences, Updating, Learning techniques, In silico.]
This paper summarizes a conference given at the beginning of the summer of 1990 on the biology of Bacillus subtilis and its genome program
[Abstract: The information collected in national and international libraries on nucleotide and protein sequences cannot be directly treated for proper handling by existing software. Therefore we evaluated the feasibility of constructing a data base for Escherichia coli using the data present in the banks. The know how thus acquired was applied to Bacillus subtilis. Specific examples of the general procedure are given]
Research in Microbiology (1991) 142: 913-916  pdf

Auparavant, le résumé présenté ici (imprimé avec une imprimante à aiguilles, comme on le remarque dans la ligne de formattage) a servi d'introduction à plusieurs conférences durant l'été et l'automne 1990 (en particulier à Seillac à une réunion organisée par l'INSERM) :

G----I----!---------!---------!---------!---------!---------!---------!---------!--D
#F62,00,00,00,03,01,40,02,01,01,08,00,80,00,00,00,00,01,05,#

Faire parler la cohérence interne des génomes

L'autonomie des systèmes vivants résulte de la cohérence interne de leur programme génétique. Les règles spécifiées par la séquence de l'ADN décident de la survie et de la reproduction de tous les organismes. Or cela correspond à un programme de longueur finie. Toutes les règles de réécriture qui interprètent le programme génétique (transcription et traduction) et fixent la structure de tous les effecteurs du métabolisme sont totalement incluses dans les séquences correspondantes des acides nucléiques et des protéines (éventuellement à la suite des relations entre plusieurs des objets correspondants). Jusqu'à présent, l'aspect cohérent des génomes est resté inaccessible, mais les nouvelles techniques de séquençage vont permettre de mettre au jour beaucoup des contraintes dues à cette cohérence. Un génome est le résultat d'une histoire, il n'est pas le fruit d'un simple hasard. Il est donc raisonnable d'espèrer découvrir des règles de construction, à la fois à partir de l'étude d'un seul génome et à partir de la comparaison des génomes entre eux. Le problème posé n'est pas sans rappeler celui du décryptage de langues disparues, du moins de celles pour lesquelles il existe une pierre de Rosette, car, dans notre cas, le retour à l'expérience est toujours possible. Du point de vue informatique, on se trouve donc confronté à la création de base de données évolutives où l'on devra reconnaître des traits pertinents à la suite d'apprentissages. La création de descripteurs, la genèse d'hypothèses exploratoires permettra d'ajouter aux traditionnelles méthodes de la biologie, in vivo et in vitro, l'expérimentation "in silico". Quelques exemples de projets seront présentés.

Une brève histoire de la bioinformatique en France est présentée ici en anglais, mais sous forme édulcorée :

A Danchin
A brief history of genome research and bioinformatics in France
Bioinformatics (2000) 16: 65-75 

voir aussi un hommage à Hiroshi Yoshikawa et à Frank Kunst