|
|
|
|
Foreword / Avertissement
Se
lancer dans l'aventure du séquençage d'un génome
entier supposait une forte infrastructure informatique. Nous avons
donc développé une série d'études
préalables pour nous convaincre que les méthodes
de l'Intelligence Artificielle étaient plus qu'un mot,
mais un véritable moyen d'accès à la connaissance.
Nous avons ainsi, pour la première fois, établi
les grandes règles de l'exportation des protéines,
en caractérisant dix-sept descripteurs de la nature des
peptides signaux. Nous avons par ailleurs établi, pour
le compte de la Communauté Européenne, les bases
conceptuelles de l'association intime du séquençage
et du calcul, créant à l'occasion le terme "in
silico" qui a depuis fait florès. Dans ce
rapport on établissait que les plus petits génomes
devraient être longs d'environ 400 à 500 kb, et l'accent
était mis sur la cohérence interne de la structure
génomique |
|
To
launch the adventure of genome sequencing assumed a considerable
infrastructure in computer sciences. We have therefore developed
a series of pre-studies meant to assess the validity of the concepts
of Artificial t? Intelligence, then fashionable. We have, for
the first time, established the basic sequence rules of protein
export, with the identification of seventeen descriptors of bacterial
signal peptides. We have also, at the request of the European
Commission, established the conceptual bases for the needed association
betwee computation and sequencing, thus creating the now fashionable
concept of experiments "in silico."
In the report for the commission it was established that: "400
to 500 kb of DNA are necessary to permit existence of the simplest
cellular organisms" and emphasis was placed on the self-consistency
of the genome |
O Gascuel, A Danchin
Protein export in prokaryotes and eukaryotes: indications
of a difference in the mechanism of exportation
J Mol Evol (1986) 24: 130-142
Ce
travail était destiné à explorer une approche
d'intelligence artificielle pour dÕcouvrir des caractères
encore inconnus dans les séquences. Nous avons identifié
ici dix-sept descripteurs, presque tous inconnus, caractérisant
les peptides signaux bactériens. Ce travail antériorise
un très grand nombre d'études réalisées
bien plus tard |
|
This
work was meant to explore the power of artificial intelligence
to uncover signals that would have not yet been known. Here we
identified seventeen descriptors, most of them unknown, that characterized
signal peptides. This work predates much of later studies in the
domain |
A
Danchin
Complete genome sequencing:
future and prospects
Commission of the European Communities Directorate general Science,
Research and Development; Biotechnology Action Programme 1988-1989 (1988)
Chapter I: pp 1-24
A Danchin, C Médigue, O Gascuel, H Soldano, A Hénaut
From data banks to data bases
Abstract: The
information collected in national and international libraries on
nucleotide and protein sequences cannot be directly treated for proper
handling by existing software. Therefore we evaluated the feasibility
of constructing a data base for Escherichia coli using the data present in
the banks. The knowhow thus acquired was applied to Bacillus subtilis.
Specific examples of the general procedure are given.]
Res Microbiol
(1991) 142: 913-916
L'apparition
des ordinateurs a complètement modifié notre accès
à la biologie, en particulier au moment de la création
des programmes de génomique. J'ai utilisé l'expression
"in silico" pour exprimer ce fait que désormais,
il faudrait compter, outre l'expérience in vivo
et in vitro, l'expérience in silico, avec
des ordinateurs. Cette expression a été utilisée
dans de nombreux exposés de présentation des programmes
génomes, et elle est apparue probablement pour la première
fois par écrit dans le compte rendu d'un exposé fait
pour la réunion internationale du consortium de Bacillus
subtilis au cours de laquelle le Japon a choisi de faire partie
du programme. |
|
The
expression "in silico" has been used in White Papers
written to support the creation of bacterial genome programs. The
sentence where "in silico" appeared first publicly
is the following:
"Experimentation
in silico
Using
the data available in libraries [...]
Two sets of experiments were performed on computers (experiments
in silico) using the consistency of the data extracted.
[...]"
|
P Glaser, F Kunst, M Debarbouille, A Vertes, A Danchin, R Dedonder
A gene encoding a tyrosine tRNA synthetase is located
near sacS in Bacillus subtilis
DNA Seq (1991) 1: 251-261
M Santana, F Kunst, MF Hullo, G Rapoport, A Danchin, P Glaser
Molecular cloning, sequencing, and physiological characterization
of the qox operon from Bacillus subtilis encoding the aa3-600
quinol oxidase
J Biol Chem (1992) 267: 10225-10231
P
Glaser, F Kunst, M Arnaud, M-P Coudart, W Gonzales, M-F Hullo, M Ionescu,
B Lubochinsky, L Marcelino, I Moszer, E Presecan, M Santana, E Schneider,
J Schweizer, A Vertes, G Rapoport, A Danchin
Bacillus subtilis genome project: cloning and sequencing of the
97 Kb region from 325o to 333o
Mol Microbiol (1993) 10: 371-384
[]
Présenté
à Elounda, en Crète, ce travail marquait la
première grande découverte de la génomique:
dans le chromosome III de la levure, et dans près de 100
kb du génome de Bacillus subtilis on remarquait
une bonne moitié de gènes totalement inconnus. Piotr
Slonimski les nomme alors les "EEC genes" (comme l'acronyme
de l'Union Européenne de ce temps) pour "elusive,
esoteric, conspicuous genes". La construction de bases de
données relationnelles introduit le concept de voisinage
dans l'analyse des génomes |
|
Presented
at Elounda in Crete, this work summarized the first
major discovery of genomics: in yeast chromosome III
as well as in a contiguous segment of almost 100 kb of Bacillus
subtilis one found some half of the genes of totally unknown
structure and function. Piotr Slonimski coins the name"EEC
genes" (as the acronym of European Union at that early
time) for "elusive, esoteric, conspicuous" genes.
The construction of relational microbial genome databases introduces
the concept of neighborhood in genome analysis |
M Santana, MS Ionescu, A Vertes, R Longin, F Kunst, A Danchin, P Glaser
Bacillus subtilis F0F1 ATPase: DNA sequence of
the atp operon and characterization of atp mutants
J Bacteriol (1994) 176: 6802-6811
F Kunst, A Vassarotti, A Danchin
Organization of the European Bacillus subtilis
genome sequencing project
Microbiology (1995) 141 ( Pt 2): 249-255
C Médigue, I Moszer, A Viari, A Danchin
Analysis of a Bacillus subtilis genome fragment
using a co-operative computer system prototype
Gene (1995) 165: GC37-51
C Médigue, T Vermat, G Bisson, A Viari, A Danchin
Cooperative computer system for genome sequence analysis
Proc Int Conf Intell Syst Mol Biol (1995) 3: 249-258
I Moszer, P Glaser, A Danchin
SubtiList: a relational database for the Bacillus
subtilis genome
Microbiology (1995) 141 ( Pt 2): 261-268
I Moszer, F Kunst, A Danchin
The European Bacillus subtilis genome sequencing
project: current status and accessibility of the data from a new World
Wide Web site
Microbiology (1996) 142: 2987-2991
F
Kunst, N Ogasawara, I Moszer, AM Albertini, G Alloni, V Azevedo, MG
Bertero, P Bessières, A Bolotin, S Borchert, R Borriss, L Boursier,
A Brans, M Braun, SC Brignell, S Bron, S Brouillet, CV Bruschi, B Caldwell,
V Capuano, NM Carter, SK Choi, JJ Codani, IF Connerton, NJ Cummings,
RA Daniel, F Denizot, KM Devine, A Düsterhöft, SD Ehrlich,
PT Emmerson, KD Entian, J Errington, C Fabret, E Ferrari, D Foulger,
C Fritz, M Fujita, Y Fujita, S Fuma, A Galizzi, N Galleron, SY Ghim,
P Glaser, A Goffeau, EJ Golightly, G Grandi, G Guiseppi, BJ Guy, K Haga,
J Haiech, CR Harwood, A Hénaut, H Hilbert, S Holsappel, S Hosono,
MF Hullo, M Itaya, L Jones, B Joris, D Karamata, Y Kasahara, M Klaerr-Blanchard,
C Klein, Y Kobayashi, P Koetter, G Koningstein, S Krogh, M Kumano, K
Kurita, A Lapidus, S Lardinois, J Lauber, V Lazarevic, SM Lee, A Levine,
H Liu, S Masuda, C Mauël, C Médigue, N Medina, RP Mellado,
M Mizuno, D Moesti, S Nakai, M Noback, D Noone, M O'Reilly, K Ogawa,
A Ogiwara, B Oudega, SH Park, V Parro, TM Pohl, D Portetelle, S Porwollik,
AM Prescott, E Presecan, P Pujic, B purnelle, G Rapoport, M Rey, S Reynolds,
M Rieger, C Rivolta, E Rocha, B Roche, M Rose, Y Sadaie, T Sato, E Scalan,
S Schleich, R Schroeter, F Scoffone, J Sekiguchi, A Sekowska, SJ Seror,
P Serror, BS Shin, B Soldo, A Sorokin, E Tacconi, T Takagi, H Takahashi,
K Takemaru, M Takeuchi, A Tamakoshi, T Tanaka, P Terpstra, A Tognoni,
V Tosato, S Uchiyama, M Vandenbol, F Vannier, A Vassarotti, A Viari,
R Wambutt, E Wedler, T Weitzenegger, P Winters, A Wipat, H Yamamoto,
K Yamane, K Yasumoto, K Yata, K Yoshida, HF Yoshikawa, E Zumstein, H
Yoshikawa, A Danchin
The complete genome sequence of the gram-positive bacterium
Bacillus subtilis
Nature (1997) 390: 249-256
Ce
travail, fruit d'une collaboration fructueuse entre l'Europe
et le Japon, donne à la communauté internationale
la référence obligée de la séquence
des génomes des bactéries à coloration
de Gram positive. Il est resté le seul de son genre
pendant près
de cinq ans, en raison des difficultés particulières
du séquençage, expliquées par l'absence
de protéine S1 dans le ribosome: il s'en suit que les
signaux de démarrage de la traduction sont particulièrement
forts dans la bactérie hôte, ce qui rend l'ADN
de B. subtilis très souvent toxique. En effet
les gènes sont alors exprimés à très
haut niveau. La base de données SubtiList,
sert de référence à l'annotation des génomes
bactériens dans le monde entier
|
|
This
work is the resulta of a fruitful collaboration between Europe
and Japan. It provides the international community with the
reference genome for Gram positive bacteria, with which other
genomes are compared and annotate. It remained the only genome
of this category to be sequenced for almost five years, because
of intrinsic difficulties in sequencing. This is accounted for
by the absence of ribosomal protein S1: as a consequence the
translation initiation signals are particularly strong, making
the B. subtilis DNA often toxic in the host bacteria.
Indeed, its genes are often expressed at a very high level,
killing the host. The SubtiList
database is the reference for annotation of bacterial genomes
world-wide |
V
Barbe, S Cruveiller, F Kunst, P Lenoble,
G Meurice, A Sekowska, D Vallenet, T
Wang, I Moszer, Médigue , A Danchin
From a consortium sequence to a unified sequence:
The Bacillus subtilis 168 reference genome
a decade later
Microbiology (2009) 155: 1758-1775
Le
domaine des bactéries est divisé en deux grandes branches où
les Firmicutes, dont le modèle est Bacillus
subtilis, occupent
un espace considérable. Le séquençage du génome a impliqué plus
de trente laboratoires, avec des expertises diverses, avec l'intention
de les combiner pour associer l'information expérimentale à la
séquence. Cela a eu la conséquence inévitable que l'expertise
en séquençage était très différente selon les groupes, en particulier
à un moment où ce travail était particulièrement long et difficile.
L'apparition de nouvelles techniques, très rapides et efficaces,
nous a incités à reprendre le travail et à le compléter par une
annotation approfondie, en collaboration avec l'Institut Suisse
de Bioinformatique. Nous avons orienté l'annotation en fonction
de la division entre le paléome (gènes qui assurent la vie et la
perpétue) et le cénome (gènes qui permettent l'occupation d'une
niche écologique spécifique. Nous observons ainsi que B.
subtilis est un épiphyte, et la nouvelle annotation devrait permettre d'explorer
des expériences de validation pour comprendre la croissance et
la survie, ainsi que permettre l'établissement de phylogénies robustes. |
|
The
bacterial domain is split into large branches among which the
Firmicutes occupy a considerable space. Bacillus subtilis has
been the model of Firmicutes for decades. Sequencing the genome
involved more than thirty laboratories, with different expertises,
in a attempt to make most of the experimental information associated
to the sequence. This had the expected drawback that the sequencing
expertise varied among the groups involved, especially
at a time when sequencing genomes was extremely hard work. The
development of efficient, fast and accurate sequencing
techniques, in parallel with the development of high level annotation
platforms motivated the resequencing work. The updated
sequence has been reannotated in agreement with the UniProt protein
knowledge base, keeping in perspective the split between the
paleome (genes necessary for sustaining and perpetuating life)
and the cenome (genes required for occupation of a niche, suggesting
here that B. subtilis is an epiphyte).
This should permit investigators to make reliable inferences
to prepare validation experiments in a variety of domains of
bacterial growth and development as well as build up accurate
phylogenies. |
C Médigue, JP Bouché, A Hénaut, A Danchin
Mapping of sequenced genes (700 kbp) in the restriction
map of the Escherichia coli chromosome
Mol Microbiol (1990) 4: 169-187
C Médigue, A Hénaut, A Danchin
Escherichia coli molecular genetic map (1000 kbp):
update I
Mol Microbiol (1990) 4: 1443-1454
C Médigue, A Viari, A Hénaut, A Danchin
Escherichia coli molecular genetic map (1500 kbp):
update II
Mol Microbiol (1991) 5: 2629-2640
C Médigue, A Viari, A Hénaut, A Danchin
Colibri: a functional data base for the Escherichia
coli genome
Microbiol Rev (1993) 57: 623-654
C
Médigue, T Rouxel, P Vigier, A Hénaut, A Danchin
Evidence for horizontal gene transfer in Escherichia
coli speciation
J Mol Biol (1991) 222: 851-856
Cet
article montre, pour la première fois, que dans le génome
de la bactérie la mieux connue, Escherichia coli,
un sixième des gènes provient d'ailleurs. Ce résultat,
qui démontre l'importance considérable du transfert
génétique latéral chez les bactéries,
montre aussi que la fidélité de la réplication
n'est pas le caractère premier des espèces, mais
que les gènes de correction des erreurs se propagent par
transfert horizontal. |
|
This
article shows, for the first time, that in the genome of the
best known bacteria, Escherichia coli, one sixth of
the genes comes from outside. This result, that emphasizes the
importance of lateral gene transfer in bacteria,
also shows that replication accuracy is not a prime character
of wild type species, but that genes coding for error proof-reading
are propagated by horizontal transfer. |
M Borodovsky, JD McIninch, EV Koonin, KE Rudd, C Médigue, A Danchin
Detection of new genes in a bacterial genome using Markov
models for three gene classes
Nucleic Acids Res (1995) 23: 3554-3562
A Hénaut, T Rouxel, A Gleizes, I Moszer, A Danchin
Uneven distribution of GATC motifs in the Escherichia
coli chromosome, its plasmids and its phages
J Mol Biol (1996) 257: 574-585
A Hénaut,
A Danchin
Analysis and Predictions from Escherichia coli sequences or E
coli in silico
In: Escherichia coli and Salmonella, Cellular
and Molecular Biology (Editor in Chief: Frederick C Neidhardt) vol.
1, chap 114, pp 2047-2065
P Guerdoux-Jamet, A Hénaut, P Nitschké, JL Risler, A Danchin
Using codon usage to predict genes origin: is the Escherichia
coli outer membrane a patchwork of products from different genomes?
DNA Res (1997) 4: 257-265
E Duchaud, C Rusniok, L Frangeul, C Buchrieser,
A Givaudan, S Taourit, S Bocs, C Boursaux-Eude, M Chandler, JF Charles,
E Dassa, R Derose, S Derzelle, G Freyssinet, S Gaudriault, C Médigue,
A Lanois, K Powell, P Siguier, R Vincent, V Wingate, M Zouine, P Glaser,
N Boemare, A Danchin, F Kunst
The genome sequence of the entomopathogenic bacterium
Photorhabdus luminescens
Nat Biotechnol (2003) 21: 1307-1313
Leptospira
interrogans Lai L
P
S N
SX
Ren, G Fu, XG Jiang, R Zeng, YG Miao, H Xu, YX Zhang, H Xiong, G
Lu, LF Lu, HQ Jiang, J Jia, YF Tu, JX Jiang, WY Gu, YQ Zhang, Z Cai,
HH Sheng, HF Yin, Y Zhang, GF Zhu, M Wan, HL Huang, Z Qian, SY Wang,
W Ma, ZJ Yao, Y Shen, BQ Qiang, QC Xia, XK Guo, A Danchin, I Saint
Girons, RL Somerville, YM Wen, MH Shi, Z Chen, JG Xu, GP Zha
Unique physiological and pathogenic features of Leptospira
interrogans revealed by whole-genome sequencing
Nature (2003) 422: 888-893
YQ
Zhang, SX Ren, HL Li, YX Wang, G Fu, J Yang, ZQ Qin, YG Miao, WY Wang,
RS Chen,Y Shen, Z Chen, ZH Yuan, GP Zhao, D Qu, A Danchin, YM Wen
Genome-based analysis of virulence genes in a non-biofilm-forming
Staphylococcus epidermidis strain (ATCC 12228)
Mol Microbiol (2003) 49: 1577-1593
Pseudoalteromonas
haloplanktis TAC125 L
P
S N
C
Médigue, E Krin, G Pascal, V Barbe, A Bernsel, PN Bertin, F Cheung,
S Cruveiller, S D’Amico, A Duilio, G Fang, G Feller, C Ho, S Mangenot,
G Marino, J Nilsson, E Parrilli, EPC Rocha, Z Rouy, A Sekowska, ML Tutino,
D Vallenet, G von Heijne, A Danchin
Coping with cold:
the genome of the versatile marine Antarctica bacterium Pseudoalteromonas
haloplanktis TAC125
Genome Res
(2005) 15: 1325-1335
Herminiimonas
arsenicoxydans
(previously known
as Cenibacter arsenoxidans, Caenibacter arsenoxydans, Cenibacterium
arsenoxidans)
D Muller, C Medigue,
S Koechler,V Barbe, M Barakat, E Talla, V Bonnefoy, E Krin,
F Arsene-Ploetze, C Carapito, M Chandler, B Cournoyer, S
Cruveiller, C Dossat, S Duval, M Heymann, E Leize, A Lieutaud,
D Lievremont, Y Makita, S Mangenot, W Nitschke, P Ortet,
N Perdrial, B Schoepp, P Siguier, DD Simeonova, Z Rouy, B
Segurens, E Turlin, D Vallenet, A Van Dorsselaer, S Weiss,
J Weissenbach, MC Lett, A Danchin, PN Bertin
A tale of two oxidation states: bacterial colonization
of arsenic-rich environments.
PLoS Genetics (2007) 3: e53
Psychromonas
ingrahamii
M Riley, JT Staley, A Danchin, TZ Wang,
TS Brettin, LJ Hauser, ML Land, LS Thompson
Genomics of an extreme psychrophile, Psychromonas
ingrahamii
BMC Genomics (2008) 9: 210
Escherichia
fergusonii and
various Escherichia coli strains
The ColiScope project
M Touchon, C Hoede,
O Tenaillon, V Barbe, S Baeriswyl, P Bidet, E Bingen, S Bonacorsi,
C Bouchier, O Bouvet, A Calteau, H Chiapello, O Clermont,
S Cruveiller, A Danchin, M Diard, C Dossat, M El Karoui,
E Frapy, L Garry, JM Ghigo, AM Gilles, J Johnson, C Le Bouguénec,
M Lescat, S Mangenot, V Martinez-Jéhanne, I Matic, X Nassif,
S Oztas, MA Petit, C Pichon, Z Rouy, C Saint Ruf, D Schneider,
J Tourret, B Vacherie, D Vallenet, C Médigue, EPC Rocha,
E Denamur
Organised genome dynamics in the Escherichia coli species results in
highly diverse adaptive paths
PLoS Genetics (2009) 5: e1000344
|
|