COIN PRESSE CONTRIBUTION SCIENTIFIQUE HISTOIRE DE LA BIOLOGIE SUMMARY JOURNALIST'S CORNER

La science se suffit à elle-même

Dans son principe elle ne devrait mettre en avant aucun nom. De fait, il faut peu de siècles pour que le nom des saavants disparaisse. Comme les artistes, les savants peuvent avoir un style, mais leurs découvertes sont aussi bien faites par eux-mêmes que par d'autres, ce qui n'est pas le cas des premiers. Aussi la découverte posthume de contributions importantes n'est pas rare. C'est d'ailleurs ce qui rend ridicule l'esprit de compétition qui anime les hommes de science, aussi bien que les adeptes des modernes Jeux du Cirque. Certains pensent qu'il faut être le premier : mais si l'œuvre d'un artiste lui est intimement liée, et disparaîtrait irrémédiablement si elle venait à être détruite, celle d'un savant réapparaîtrait à l'occasion.

Il est donc paradoxal de présenter ici l'activité d'une vie consacrée à la science, sinon pour en souligner le style. Pourtant, prise comme un simple matériau de construction, cette entreprise est utile : elle est repère, ou borne, à laquelle on peut s'accrocher (ou se heurter). Les voies de la création de la connaissance ne sont pas tracées, elles se constituent de bribes et de morceaux, où les éléments biographiques, purs accidents de l'histoire, ont leur part. Cette présentation gagne à être factuelle, au risque d'être ennuyeuse. Présenté à la troisième personne, ce bref panorama illustre une recherche dans un pays qui, depuis longtemps hélas, ne s'y intéresse plus beaucoup, laissant à d'autres le soin de faire les découvertes qu'il a la naïveté de penser pouvoir utiliser à son compte. Mirage étrange qui illustre la décadence de ce qui fut, autrefois, un grand pays. Mais si l'on ne continue pas à tenter de semer, qui pourra faire la récolte, même maigre ? Un aspect dominant de l'activité présentée ici est le refus du fractionnement du savoir en champs clos que les uns ou les autres voudraient se réserver. Savant et philosophe sont les deux faces d'une même monnaie. Au milieu des années 1950, CP Snow, en Grande Bretagne, publiait le texte d'une conférence qui a depuis fait date. Il décrivait The Two Cultures, qui séparaient dans son pays le monde des Lettres et des Arts, du monde de la Science. A cette époque, il était encore possible en France de ne pas les séparer, et de considérer que raison poétique et raison scientifique étaient deux faces d'une même tentative humaine de se relier consciemment au réel. Depuis, il ne reste presque plus rien de ce qui faisait la culture générale de l'« honnête homme ». L'idée même d'une référence aux créations produites par nos ancêtres est devenue anathème, comme cela fut anathème durant la Révolution Culturelle en Chine. Il est désormais difficile d'avoir accès, à l'école, aux langues et aux traditions grecques et latines qui nous fondent pourtant (et le même le monde arabe, à son origine, a eu soin de préserver, et de diffuser ce lien qui est à la base de la connaissance scientifique, puis le détruit aujourd'hui). Dix ans de Révolution Culturelle ont fini par détruire beaucoup de ce qui était la Chine pendant des millénaires, et reconstituer une élite intellectuelle a pris du temps, et se trouve encore loin de retrouver la situation antérieure. Il suffit de lire l'immensité des commentaires qui inondent tout type d'information, aussi bien que les bloc-notes, blogs aussi suffisants qu'ignorants et niais, pour être envahi par la crainte que la situation dans nos pays ne devienne bien pire que celle de la Chine de naguère.

Et l'ignorance généralisée, fondée sur la dictature de l'image et du quotidien et une bienséance inspirée de l'Amérique sans Histoire, a conduit à la multiplication des prés carrés — bien sûr y compris en Science — où les uns ou les autres exigent que l'on montre patte-blanche pour avoir le droit de dire son mot. Cela n'a rien à faire avec le Savoir, bien au contraire, et ceux qui s'interrogent sur une incursion dans un domaine qu'ils pensent leur appartenir sont bien ceux qui craignent qu'un regard extérieur, soudain, ne mette en évidence leurs terribles limites...

Biographie succincte

(vue plus détaillée)

Mathématicien à l'École Normale Supérieure, Antoine Danchin a d'abord obtenu un DEA de Mathématiques Pures (Algèbre et Théorie des Nombres, 1966 avec Pierre Samuel, Théorie Classique du Potentiel, 1967, avec Marcel Brelot), puis un doctorat de 3e cycle en Chimie Physique (1967) pour une étude par Résonance Magnétique Nucléaire des ARN de transfert, à l'Institut de Biologie Physico-Chimique à Paris. Il a été recruté par le Centre National de la Recherche Scientifique en 1968 dans le laboratoire de Marianne Grunberg-Manago à l'Institut de Biologie Physico-chimique. Son travail s'est poursuivi à l'école Polytechnique, sous la forme d'une thèse de doctorat d'état ès Sciences Physiques (1971) au sein du laboratoire de Physique de la Matière Condensée, dirigé par Ionel Solomon.

Après sa thèse, AD a développé une méthode de marquage des sites actifs des enzymes par des métaux de transition, analogues covalents du magnésium, à l'Institut Pasteur. En parallèle, il a, avec Maurice Guéron, créé le premier enseignement de biologie à l'Ecole Polytechnique (1972-1976). Revenu à l'Institut de Biologie Physico-Chimique, il y a réintroduit avec Mathias Springer la génétique bactérienne qui avait disparu après le départ de Boris Ephrussi pour le Centre de Génétique Moléculaire à Gif-sur-Yvette, avant de revenir à l'Institut Pasteur, où il a créé l'Unité de Régulation de l'Expression Génétique en 1986, puis en 2000 l'Unité de Génétique des Génomes Bactériens. En 1973, Jacques Monod lui demande d'être l'un des coordonnateurs du Centre Royaumont pour une Science de l'Homme, et il participe activement, avec Kot Jelenski et Massimo Piattelli-Palmarini, au programme de ce Centre qui devait disparaître peu après la mort de Jacques Monod au milieu de l'année 1976. De cette activité naîtront divers programmes à connotation anthropologique ou philosophique, en particulier autour du Centre Transcultura, présidé par Umberto Eco qui s'intéressait aux visions anthropologiques du monde occidental par les non-occidentaux.

A partir du milieu de l'année 2000 AD a créé et dirigé pendant trois ans le HKU-Pasteur Research Centre Ltd à Hong Kong, pour y développer un programme de génomique bactérienne dans un contexte où ce type de recherche n'existait pas encore. AD a été Professeur Honoraire à l'Université de Hong Kong jusqu'en 2014, et Conseiller Scienfique au CEA. Il est désormais professeur honoraire au BGI à Shenzhen, et professeur extraordinaire à l'Institut de Cardiométabolisme et Nutrition au CHU Pitié-Salpêtrière. Il est fondateur et directeur scientifique d'une entreprise de biotechnologie, AMAbiotics SAS , consacrée à la bioremédiation métabolique.

AD est membre de l'EMBO et membre de l'International Advisory Committee de l'International Nucleotide Sequence Database collaboration (DDBJ / EMBL-EBI / GenGank) (président 2001, 2004, 2007, 2010, 2013). Il est membre de l'Académie des Sciences.

Recherche

Cinq volets différents, chronologiquement déterminés par son travail de thèse (thèse de 3ème cycle et thèse d'état) (1967-1971), un changement de thème post-doctoral (1971-1976), la conversion de son activité de recherche à la génétique moléculaire (depuis 1976), et le choix de mettre en place le séquençage complet d'un génome bactérien (1986-2008), et, depuis 2009, l'idée d'utiliser la motivation sociale de la recherche - via la construction d'une entreprise de biotechnologie, AMAbiotics - comme raison d'être de la création du savoir, constituent l'ensemble des travaux expérimentaux et théoriques d'Antoine Danchin. La génomique fonctionnelle et tout ce qui lui est associé a servi de point de départ à la création de l'Unité de Génétique des Génomes Bactériens qui avait pour thème central l'étude de la corrélation possible entre l'architecture du génome et celle de la cellule. Depuis 2007, AD s'intéresse aux relations qui existent entre l'organisation du cœur des génomes bactériens et la perpétuation de la vie, en relation avec la nature de l'information portée par le programme génétique. Ces travaux le conduisent à placer le concept de Sélection Naturelle au sein même des lois de la physique. De cet ensemble il est possible d'extraire une vue synthétique, sous la forme de ses contributions scientifiques principales.

Activités antérieures (bibliographie)

AD a commencé par étudier, à l'Institut de Biologie Physico-chimique et à l'école Polytechnique, la dynamique de la structure tertiaire des ARN de transfert, principalement au moyen de techniques de résonance magnétique nucléaire (RMN) et de résonance paramagnétique électronique (Chapitre I). Ce travail a mis en évidence le rôle principal du spin électronique du manganèse dans la relaxation des protons de l'eau. En biologie moléculaire, il a démontré la mobilité intra-moléculaire de l'ARN de transfert grâce à un développement technique (mise au point d'un spectromètre de RMN à impulsion, à champ et température variables). Au cours de son travail post-doctoral, AD a inventé une technique de marquage d'affinité des macromolécules au moyen de complexes métalliques non échangeables. Après avoir appliqué cette technique aux acides nucléiques, il l'a développée en marquant le site actif de diverses enzymes, notamment la glycogène phosphorylase b et la myosine. Peut-être en raison de son caractère inhabituel (chimie biominérale) cette technique est restée inexploitée, malgré son intérêt en biologie structurale, et son intérêt potentiel en pharmacologie.

Recherches de l'Unité de Régulation de l'Expression Génétique (1986-2000) (bibliographie)

Le thème des recherches de l'Unité de Régulation de l'Expression Génétique (REG) consistait à identifier les régulations métaboliques assurant la coordination de l'expression génétique chez Escherichia coli et Bacillus subtilis (Chapitre II). Les premiers travaux de l'Unité ont mis en évidence l'existence de hiérarchies métaboliques dont certains effecteurs, comme la sérine, le 2-cétobutyrate ou l'AMP cyclique, jouent un rôle clef dans la coordination des synthèses macromoléculaires. Après de nombreuses années d'études, le rôle de la sérine a été déchiffré en janvier 2006, grâce à la conjonction de plusieurs approches, et en particulier grâce à l'annotation de nouveaux génomes et à la découverte de la "persistance" de certains gènes inattendus chez un grand nombre de bactéries. La nature chimique de cette molécule conduit à des incompatibilités mutuelles qui ne peuvent se résoudre qu'au travers de régulations compliquées, variables dans les différentes espèces. Chez le colibacille il s'agit du système des phosphotransférases responsables du transport du glucose et du contrôle de la synthèse de l'AMP cyclique, de la protéine H-NS, et du couplage entre la traduction et la transcription. Le cétobutyrate intervient lors du passage de l'anaérobiose à l'aérobiose et contrôle, par le biais du système des phosphotransférases transporteuses de sources de carbone, à la fois la perméation au travers de la membrane, les flux métaboliques, et les synthèses macromoléculaires. Il s'agirait donc d'un des médiateurs de l'effet Pasteur.

En collaboration étroite avec l'Unité de Biochimie des Régulations Cellulaires, dirigée par Agnès Ullmann, ces travaux ont conduit les chercheurs de l'Unité à isoler le gène de l'adénylcyclase et de plusieurs des protéines des phosphotransférases chez E. coli, d'abord, puis chez un grand nombre d'autres organismes. Cela a permis de comprendre certains aspects structuraux de ces protéines essentielles et de la régulation de leur expression, puis à en développer l'étude comparative.

De ce travail il ressort que les adénylcyclases forment plusieurs classes bien distinctes, reconnues par une classification internationale créée à cette occasion . Les adénylcyclases de la première classe se trouvent chez les entérobactéries et les familles apparentées, ainsi que les Pasteurellaceae, les Aeromonas sp, ou les Pseudomonadales. Elles sont constituées de deux domaines, le domaine amino-terminal étant seul doué d'activité catalytique. Les cyclases toxiques constituent la deuxième classe. On les trouve chez deux agents pathogènes très éloignés, Bordetella pertussis – agent de la coqueluche – et Bacillus anthracis – agent du charbon, bien connu depuis les travaux de Pasteur et de Koch. Elles sont activées par la calmoduline. Leur gène a été cloné dans l'Unité (en collaboration avec A. Ullmann et M. Mock, respectivement) grâce à une technique originale d'un usage très général (clonage à partenaires multiples, antécédent conceptuel et expérimental repris dans la technique du "double hybride", qui a fait l'objet d'un brevet en 1989). Ces toxines sont extrêmement actives. Elles ont été caractérisées avec Octavian Bârzu et ses collègues. L'étude de la sécrétion de la cyclase de l'agent de la coqueluche s'est révélée particulièrement fascinante, car elle intègre, via la formation d'une protéine bifonctionnelle, à la fois adénylcyclase et hémolysine, un mécanisme de sécrétion original aujourd'hui connu chez beaucoup d'organismes pathogènes, et dont le parangon est l'hémolysine pathogène du colibacille. Il existe enfin une troisième classe, qui a été d'abord identifiée chez la levure, et ensuite chez deux bactéries très distantes Rhizobium meliloti et Brevibacterium liquifaciens (collaboration avec Fergal O'Gara, Irlande et Elizabeth Peters, Grande Bretagne), puis chez des bactéries différenciées, Stigmatella aurantiaca et Streptomyces coelicolor. Cette dernière classe, qui comprend les adényl- et guanyl-cyclases des eucaryotes supérieurs (découvertes ailleurs dans le monde) est antérieure à la séparation phylogénétique des bactéries et des eucaryotes. Cela pose donc des questions remarquables quant à leur origine. Au moyen d'un crible génétique, il a été possible de faire évoluer in vivo la spécificité de l'enzyme de R. meliloti de son substrat ATP vers le GTP, ce qui a découvert un certain nombre des régions importantes pour l'activité de l'enzyme. Enfin, une quatrième classe de cyclases, très énigmatique, et reliée au produit de gènes d'archéobactéries, a été découverte chez Aeromonas hydrophila, et caractérisée au laboratoire (les caractéristiques de cette quatrième classe ont été publiées en 1998). Il s'agit là d'un cas surprenant de convergence évolutive. On sait aujourd'hui que cette enzyme est de la même famille qu'une phosphatase nouvelle, la thiamine triphosphate phosphatase dont le rôle est encore loin d'être compris. Il est d'ailleurs probable que l'activité principale de ces enzymes n'est pas celle d'adénylcyclase, mais qu'il s'agit d'une activité contaminante ("promiscuous" en anglais), comme c'est le cas très fréquemment.

Cette interrogation sur l'évolution est l'une des raisons qui ont conduit l'Unité à s'impliquer dans l'aventure que représente le séquençage d'un génome bactérien en entier. Après une période transitoire où quelques recherches ont été menées sur la protéine H-NS, impliquée dans les contrôles globaux de l'expression des gènes chez E. coli et dans la virulence des entérobactéries, un groupe de chercheurs de l'Unité s'est ensuite consacré à l'analyse des effets positifs, et non plus négatifs, de cette protéine sur l'expression de certains opérons. En dehors de la découverte que l'absence de ce gène conduit à un phénotype fortement mutateur, où les mutations sont principalement des délétions, les contrôles positifs et l'action de H-NS sur l'activité de l'adénylcyclase forment le thème actuel de recherches sur cette intéressante protéine, très étudiée dans le monde.

L'étude détaillée de groupes de régulations collectives de l'expression des gènes du colibacille a conduit AD en 1986 à étudier la faisabilité d'un programme de séquençage du génome total d'un organisme, cela afin d'en analyser les propriétés globales et en particulier la cohérence interne. Une conjonction d'intérêts a alors permis de mettre en forme ce projet, en collaboration avec Raymond Dedonder, autour de la génétique de Bacillus subtilis (chapitre II ; voir aussi La Barque de Delphes). Entre 1988 et 1997, animé par Philippe Glaser, un laboratoire de séquençage partiellement automatisé a déterminé au sein de l'Unité la séquence de plus de 300 kb du génome de B. subtilis. Ce qui est aujourd'hui banal était à l'époque une prouesse et il a fallu dix ans plus tard reséquencer entièrement le génome avec les techniques les plus récentes (en 2007-2008) en collaboration avec le Génoscope, pour établir une séquence de référence sans erreur. Le projet de séquençage total du génome s'est concrétisé sous la forme d'une collaboration européenne et japonaise, coordonnée par Frank Kunst pour l'Europe, et Hiroshi Yoshikawa et Naotake Ogasawara pour le Japon. L'Unité avait en charge la responsabilité scientifique des données de séquençage et de leur annotation, et l'ensemble a été entièrement réannoté en 2008. La base de données relationnelle SubtiList constitue la référence pour tous les chercheurs qui s'intéressent au génome de B. subtilis, et aux génomes bactériens en général.

Comme la séquence complète du génome a été connue au début de l'année 1997, l'activité du laboratoire s'est alors dirigée vers ce qui était l'objectif initial de l'Unité, à savoir l'exploration fonctionnelle du génome, à partir de l'identification de la fonction de tous ses gènes, et plus spécialement de la coordination de leur expression. À cette fin, en collaboration avec Alain Hénaut et ses collègues de l'Université de Versailles Saint Quentin, et avec Alain Viari et ses collègues de l'Atelier de Bioinformatique à l'Université Paris 6, l'Unité a constitué un pôle de recherche permettant le développement des études informatiques liées aux génomes. Cette collaboration s'est concrétisée par la constitution, entre autres structures, d'un Groupement de Recherche, Génomes et Informatique, dirigé par AD et François Rechenmann (de l'INRIA à Grenoble), associant une cinquantaine de chercheurs. Cela a permis de valider la contribution de certains apports de l'Intelligence Artificielle pour l'analyse des séquences d'acides nucléiques et des protéines, de développer de nombreuses méthodes d'analyse et de créer une plateforme intégrant à la fois les objets biologiques issus du séquençage et les méthodes d'analyse associées, ImaGene®, GenoStar®, puis IOGMA®. L'étude des peptides signaux des protéines sécrétées, au moyen d'une de ces techniques a découvert des descripteurs très précis de ces signaux d'adressage. En marge de ces activités, un résultat expérimental acquis dans l'Unité, la comparaison du produit des gènes de protéines impliquées dans la synthèse de la cystéine et du tryptophane a ouvert des perspectives intéressantes sur l'origine de certaines voies métaboliques. Ces premiers travaux ont motivé un investissement notable en temps de recherche informatique pour l'analyse des séquences. Ils ont aussi conduit à l'un des thèmes centraux de l'Unité de Génétique des Génomes Bactériens, l'étude du métabolisme du soufre. Ils ont aussi mis en évidence qu'il existe un lien significatif entre les questions d'origine, de l'origine de la vie en particulier, et ce qu'il est possible de comprendre à partir des génomes actuels. Mais, comme cela a été observé dans le cas du génome de la levure, le résultat sans doute le plus surprenant des premiers travaux qui ont permis la détermination dans l'Unité de la séquence d'un fragment de 300 kilobases du génome de B. subtilis, est que la moitié des gènes exprimés ne ressemble à rien de connu (1991). Cela démontrait de façon éclatante que le séquençage des génomes entiers ouvre un nouveau pan de la génétique par la description de gènes pour l'instant tout à fait énigmatiques. Cela justifie particulièrement, par conséquent, un investissement important dans l'exploration de la nature des gènes par des moyens informatiques, et sa validation expérimentale par l'inactivation systématique de tous les gènes de l'organisme et l'analyse des phénotypes correspondants.

Au delà de l'approche expérimentale, AD a consacré une partie de son temps à la réflexion formelle (Chapitre III). Cela l'a amené à proposer, avec Jean-Pierre Changeux et Philippe Courrège, un modèle épigénétique de la mémoire et de l'apprentissage dans le système nerveux, et à décrire les caractères élémentaires de réseaux neuromimétiques. Cette approche théorique se relie aujourd'hui formellement à l'approche informatique de l'exploration des génomes entiers.

Un dernier aspect de l'activité du responsable de l'Unité concernait la réflexion épistémologique, l'éthique et la communication du savoir (Chapitre IV). Cela a été, entre autres, concrétisé par un premier livre sur la Biologie Moléculaire paru en 1978 et qui faisait la synthèse des cours donnés au cours des quatre années précédentes à l'Ecole Polytechnique. Un second livre, L'Œuf et la Poule, consacré au code génétique, est paru en 1983 et le troisième, Une Aurore de Pierres, paru fin 1990, tente d'éclairer de façon nouvelle la question des origines, en la reliant aux projets actuels de séquençage de génomes entiers. Un quatrième livre, La Barque de Delphes, traite de ce que dit le texte des génomes. D'une façon générale la position épistémologique défendue par AD, tout en insistant sur l'importance primordiale de l'expérience, se veut assez éloignée de l'empirisme radical anglo-américain et se trouve développer certains aspects de la tradition scientifique grecque, plus orientée vers la recherche d'explications que vers la simple collection des faits.

Recherches dans l'Unité de Génétique des Génomes Bactériens et création du HKU-Pasteur Research Centre (Chapitre V) (bibliographie)

La révolution de la génomique qui a transformé la biologie continue à produire des découvertes spectaculaires. Alors que le monde médiatique tend à parler presque exclusivement du “ génome humain ”, on ne pourra y comprendre quelque chose qu'au travers de la connaissance de puissants modèles, microbiens en particulier. L'atome de vie, en effet, est la cellule. C'est ainsi que tous les grands centres de génomique dans le monde se sont mis à développer l'étude des génomes microbiens, et c'est d'ailleurs là que les deux plus grandes découvertes du domaine ont été faites au cours des années passées (avec une contribution majeure de l'Unité). D'une part les gènes ne sont pas fixes, mais beaucoup tendent à se propager d'un organisme à l'autre (transfert génétique “ horizontal ”). D'autre part une fraction très élevée des gènes, quel que soit l'organisme, est sans fonction connue. C'est d'autant plus surprenant que nous connaissons désormais la séquence du génome de plusieurs milliers de bactéries. Dans ce contexte, le travail de l'Unité, en collaboration avec l'activité menée par AD au moment où il dirigeait le HKU-Pasteur Research Centre qu'il a créé à Hong Kong, a consisté à explorer ces fonctions inconnues. Ce travail combine les travaux expérimentaux à la paillasse, systématiquement associés à des travaux in silico (créant et utilisant des approches informatiques), pour réaliser des expériences plus conceptuelles qui servent de référence et de prédiction pour réaliser celles qui se déroulent dans les laboratoires expérimentaux. La conjecture centrale qu'explorait l'Unité est de savoir si, et dans l'affirmative pourquoi, les gènes ne sont pas répartis au hasard dans les chromosomes. Il va de soi que les nombreux accidents qui arrivent nécessairement au cours de la reproduction conduisent les gènes à se modifier, à disparaître ou à changer de place. On attendrait donc, au bout d'un temps assez long, une répartition plus ou moins aléatoire de ces gènes. Mais l'idée même qui a fondé la génomique conceptuelle, dérivée de la métaphore de programme génétique, est qu'une cellule se comporte un peu à la manière d'un ordinateur, où la machine est bel et bien séparée physiquement des programmes et des données qu'elle exploite. Or on sait bien qu'un ordinateur n'est pas capable de se dupliquer. Que faut-il donc de plus ? John von Neumann au début des années 1960 a montré que si cela devait être possible, alors il faudrait quelque part une image de la machine, découpée en un réplicateur et un constructeur. Il fallait donc explorer si la cellule et son programme génétique sont un ensemble organisé. De façon plus concrète, l'ordre des gènes dans le génome est-il quelconque ? Et, en parallèle, où se trouvent, dans la cellule, les produits des gènes : les trouve-t-on n'importe où ?

Une partie importante du travail de l'Unité a organisé les données de la connaissance biologique (Ivan Moszer, et construction des bases de données GenoList, jusqu'à son départ de l'unité), et d'autre part a analysé la structure des génomes (Eduardo Rocha et certains chercheurs du HKU-Pasteur Research Centre). La première découverte la plus surprenante de la nouvelle Unité, GGB, a été que les gènes essentiels à la vie des bactéries sont situés dans le brin précoce de l'ADN qui est répliqué directement sans discontinuité. Cela ne s'explique pas par le niveau d'expression de ces gènes (il n'y a pas corrélation avec un haut niveau d'expression), mais s'explique par l'absence de conflit entre transcription et réplication pour ces gènes, car les collisions qui se produisent lorsque les gènes sont situés sur le brin complémentaire doivent souvent conduire à des ARN messagers tronqués, et donc à des protéines tronquées, toxiques pour cette raison. Cette découverte dit aussi que le produit de ces gènes essentiels fait toujours partie de complexes formés de plusieurs protéines, car on ne peut expliquer aisément la toxicité d'un produit tronqué que par la destruction du complexe qu'il forme (imaginons ce qu'il adviendrait d'un immeuble dont certaines poutres seraient raccourcies !). En parallèle, l'Unité a participé à la détermination de la séquence du génome complet de plusieurs bactéries : Leptospira interrogans (en collaboration avec le Centre de Séquençage de Shanghai), bactérie particulièrement dangereuse infectant les paysans qui travaillent dans les rizières ; Staphylococcus epidermidis (collaboration avec le même Centre et l'Université Fudan), bactérie de l'environnement importante pour les infections acquises en mileu hospitalier ; et Photorhabdus luminescens (séquencé par le Laboratoire de Génomique des Microorganismes Pathogènes de l'Institut), pathogène d'insecte extraordinairement virulent, y compris envers les larves de moustiques (Jean-François Charles, Sylviane Derzelle et leurs collaborateurs). D'autres projets de génomique ont suivi : d'abord le séquençage du génome d'une bactérie psychrophile, hôte de l'Océan Antarctique, Pseudoalteromonas haloplanktis (et la description détaillée du génome était donc prête pour l'Année Polaire), et au travers du GDR 2909 coordonné par Philippe Bertin (Université Louis Pasteur, Strasbourg) le séquençage du génome d'une bactérie résistante à l'arsenic, Herminiimonas arsenicoxydans.

A ce stade il est essentiel de comprendre où les produits des gènes se répartissent dans la cellule. L'étude de l'uridylate kinase par un groupe qui s'est joint à l'Unité (Anne Marie Gilles et Octavian Bârzu) a donné d'intéressantes informations à ce propos. Une autre approche a été de comprendre l'organisation dans la cellule de la production des molécules contenant du soufre, en raison de la réactivité considérable de cet élément. L'étude du métabolisme de l'atome de soufre (présent dans toutes les protéines) a donc été privilégiée (Isabelle Martin-Verstraete à Paris et Agnieszka Sekowska à Hong Kong) en particulier parce que les connaissances étaient encore très limitées à son propos, en raison de la grande difficulté des études biochimiques et génétiques qui lui sont associées. Nous avons mis au jour de nouvelles voies métaboliques chez B. subtilis (l'un des deux grands modèles des bactéries) et mieux caractérisé la voie de la recyclage de la méthionine, qui est désormais bien comprise. 

Enfin, l'année 2003 avait vu se développer l'épidémie de pneumonie atypique (Syndrome Respiratoire Aigu Sévère) et AD a pensé nécessaire de participer a la lutte contre cette maladie, d'une part par des études théoriques sur les génomes des coronavirus (au HKU-Pasteur Research Centre) et d'autre part au travers d'une étude épidémiologique permettant de se faire une idée de l'origine de la maladie et de son développement (en collaboration avec l'INRIA et le Département de mathématiques de l'Université de Hong Kong). Le modèle proposé, celui d'une double épidémie, causée par un virus initial inoffensif, qui mute chez certains patients pour conduire au phénomène de SRAS cadre bien avec les observations sur le terrain. Ce modèle suggère que le virus initial pourrait rester endémique et conduire à une résurgence occasionnelle de la maladie. Il a aussi l'intérêt de suggérer que l'infection causée par le premier protège probablement contre le SRAS, ce qui indique qu'un vaccin serait possible (du moins un vaccin ayant un effet significatif, mais peut-être sur une durée limitée). Ces travaux reviennent sur le devant de la scène avec l'apparition en 2012 du nouveau coronavirus, MERS_CoV. Ces études ont été complétées par une analyse de nouveaux modèles possibles pour expliquer les épidémies de maladies à prion, en imaginant une transmission vectorielle.

Principales contributions scientifiques france

De cet ensemble de travaux on peut extraire quelques repères plus importants. Mais un travail obscur peut avoir une influence majeure. Comment savoir ce qui a permis à tel ou tel de développer une nouvelle idée : quelle lecture, quelle association, et, de nos jours, quelle base de données  ? Suivre le devenir d'un mot, d'une expression dans la littérature ne permet pas souvent de revenir à la cause qui l'a fait se répandre. Il est ainsi amusant de voir le sort de l'expression "in silico" ou de l'approche inductive par analyse des "voisinages" qui démontrent très clairement le rôle pourtant obscur (ou plus exactement anonyme) d'une contribution importante au passage de la vision technologique du séquençage des génomes à une vision réellement conceptuelle... L'ensemble de la recherche menée par AD est centré sur une unique question : peut-on trouver des règles d'organisation dans la cellule montrant comment les gènes fonctionnent ensemble et concourent ainsi à l'harmonie du développement cellulaire ? C'est autour de ce thème qu'on peut tenter d'isoler quelques contributions significatives, illustrant un style de recherche certainement plus gréco-latin qu'anglo-américain.

Pour répondre à cette question très générale AD a d'abord développé un système d'analyse génétique chez les bactéries. Il l'a abordée de façon expérimentale concrète par la recherche de signaux en apparence redondants dans les synthèses macromoléculaires chez les bactéries, une sorte de "ponctuation secondaire" dans l'expression du message génétique. L'accent sur l'analogie linguistique venait de sa contribution à la réflexion sur les mécanismes sélectifs et en particulier à ceux qui sont à la base de la mémoire et de l'apprentissage. L'étude du démarrage du processus de traduction, qui combine deux signaux chez les bactéries (un signal métabolique d'étiquetage de la première méthionine et la structure d'un ARN de transfert particulier) l'a conduit, à la suite d'une approche essentiellement génétique, à la découverte d'une anomalie ubiquiste du métabolisme couplant réplication, transcription, traduction et division cellulaire. Les mutants affectant ce processus ont été analysés les uns après les autres. Ils impliquaient spécifiquement la terminaison de la transcription, le démarrage de la traduction, le couplage strict (“stringent”) entre ces processus, le métabolisme des dérivés à un carbone, la production d'AMP cyclique, une protéine longtemps considérée comme une histone bactérienne, la protéine H-NS et la voie de synthèse des acides aminés branchés. Cette liste "à la Prévert", produite par l'expérience même, explique les fils suivis, un à un, pour tenter de démêler l'écheveau de ces interactions surprenantes, enfin compris en janvier 2006. A partir du milieu des années 1980, AD a considéré qu'il était raisonnable de tenter d'analyser ce même problème non plus au travers de l'étude des gènes individuellement impliqués, mais via la connaissance globale des génomes. A cette occasion, AD a introduit le concept d'expérimentation “in silico comme complémentaire de l'expérience in vivo ou in vitro pour l'étude des génomes (ce terme a été utilisé pour la première fois, en 1988-1989, dans ses discussions avec la Communauté Européenne, destinées à justifier conceptuellement la naissance de la génomique). La question s'est alors transformée en une conjecture simple, reposant sur une réflexion de von Neumann à propos des Machines de Turing : existe-t-il une relation entre l'organisation du génome et l'architecture de la cellule ? Les travaux les plus récents menés à ce sujet tendent à répondre par l'affirmative. L'exploration actuelle menée par le laboratoire qu'il dirige cherche à identifier les contraintes biochimiques et physiques qui conduisent à la stabilisation sélective des structures génomiques ainsi découvertes. Elle requiert une connaissance approfondie du métabolisme, à la base des applications proposées par la société de biotechnologie, consacrée à la bioremédiation métabolique, AMAbiotics.

Découverte des adénylcyclases toxiques (coqueluche et charbon), découverte et caractérisation moléculaire de quatre classes indépendantes d'adénylcyclases (convergence évolutive), création de la classification internationale des cyclases, 1988-1998

L'implication de l'AMP cyclique dans la sensibilité à la sérine a conduit AD à l'analyse génétique puis biochimique des adénylcyclases. Après avoir été le premier à isoler, caractériser et séquencer le gène complet d'une adénylcyclase (celle d'Escherichia coli), le laboratoire dirigé par AD s'est attaché à trouver le moyen de caractériser les adénylcyclases connues comme toxines. Pour cela il a créé une technique originale, ancêtre conceptuelle de la technique dite du “double hybride”, le laboratoire a isolé et caractérisé les gènes des cyclases toxiques de l'agent de la coqueluche et du charbon, inactives chez la bactérie mais activées par la calmoduline de l'hôte, en même temps que leur système de sécrétion :

P Glaser, D Ladant, O Sezer, F Pichot, A Ullmann, A Danchin
The calmodulin-sensitive adenylate cyclase of Bordetella pertussis: cloning and expression in Escherichia coli
Mol Microbiol (1988) 2: 19-30 pubmed

P Glaser, H Sakamoto, J Bellalou, A Ullmann, A Danchin
Secretion of cyclolysin, the calmodulin-sensitive adenylate cyclase-haemolysin bifunctional protein of Bordetella pertussis
EMBO J (1988) 7: 3997-4004 pubmed

Pour démontrer l'universalité de la méthode, AD a utilisé l'approche symétrique pour cloner l'ADNc de calmodulines mammifères :

A Danchin, O Sezer, P Glaser, P Chalon, D Caput
Cloning and expression of mouse-brain calmodulin as an activator of Bordetella pertussis adenylate cyclase in Escherichia coli
Gene (1989) 80: 145-149
pubmed

Ce travail a, dès 1988, posé à AD un certain nombre de problèmes éthiques (récemment mis au goût du jour sous le nom de “bioterrorisme”) discutés dans :

A Danchin
Doute et création
In: "La Responsabilité, la condition de notre humanité"
Autrement (1994) 14:249-266

HKU_Pasteur
A Danchin
Not every truth is good. The dangers of publishing knowledge about potential bioweapons
EMBO Rep (2002) 3: 102-104 pdf

L'ensemble des premiers travaux sur les adénylcyclases a été résumé dans :

A Danchin
Phylogeny of adenylyl cyclases
Adv Second Messenger Phosphoprotein Res (1993) 27: 109-162 pubmed

Cet article de revue est la référence internationale pour la classification des adénylcyclases, sous la forme, initialement, de trois classes d'origine évolutive différente (convergence évolutive) : Classe I, cyclases des entérobactéries et bactéries apparentées ; Classe II, cyclases toxiques sécrétées ; Classe III, classe “universelle” présente aussi bien chez les bactéries que chez les eucaryotes supérieurs. Une quatrième classe, elle aussi d'origine phylogénétique différente, a été découverte dans l'Unité quelques années plus tard :

O Sismeiro, P Trotot, F Biville, C Vivarès, A Danchin
Aeromonas hydrophila adenylyl cyclase 2: a new class of adenylyl cyclases with thermophilic properties and sequence similarities to proteins from hyperthermophilic archaebacteria
J Bacteriol (1998) 180: 3339-3344
pubmed J_Bact

La classe “universelle” (classe III) des cyclases regroupe adényl- et guanyl-cyclases, et une méthode de sélection originale permet de passer de l'une à l'autre activité (il s'agit là d'une des toutes premières et rares expériences où l'étude moléculaire du changement de substrat d'une enzyme a été menée à bien) :

A Beuve, A Danchin
From adenylate cyclase to guanylate cyclase. Mutational analysis of a change in substrate specificity
J Mol Biol (1992) 225: 933-938
pubmed

• Découverte de la généralité du transfert génétique horizontal chez les bactéries, 1991-1999

L'étude des génomes supposait une analyse globale in silico des propriétés du “texte” des gènes. Une première analyse de 800 gènes du colibacille a permis de les classer en trois catégories : cœur du métabolisme, gènes exprimés à haut niveau en croissance rapide, et ce qui était totalement inattendu, gènes venant d'ailleurs…

C Médigue, A Viari, A Hénaut, A Danchin
Escherichia coli molecular genetic map (1500 kbp): update II
Mol Microbiol (1991) 5: 2629-2640 pubmed

C Médigue, T Rouxel, P Vigier, A Hénaut, A Danchin
Evidence for horizontal gene transfer in Escherichia coli speciation
J Mol Biol (1991) 222: 851-856 pubmed

Ce travail très précoce de génomique in silico démontre pour la première fois qu'un sixième au moins des gènes du colibacille est issu d'un transfert génétique horizontal. Il montre aussi que les gènes antimutateurs proviennent d'un transfert de ce type, suggérant que les bactéries de l'environnement sont la plupart du temps dans un état mutable (Escherichia coli s'est longtemps appelée mutabile), et se fixent dans un état plus constant lorsqu'elles rencontrent un biotope favorable. L'organisation cellulaire est une autre conséquence du transfert génétique horizontal :

P Guerdoux-Jamet, A Hénaut, P Nitschké, JL Risler, A Danchin
Using codon usage to predict genes origin: is the Escherichia coli outer membrane a patchwork of products from different genomes?
DNA Research (1997) 4: 257-265 pubmed

La généralité de cette observation inattendue sera démontrée quelques années plus tard dans le cas de Bacillus subtilis. Elle est si bien acceptée qu'elle est désormais considérée comme un lieu commun :

I Moszer, EPC Rocha, A Danchin
Codon usage and lateral gene transfer in Bacillus subtilis
Curr Opin Microbiol (1999) 2: 524-528 pubmed pdf

Un travail en collaboration avec M. Vergassola a permis de montrer de le génome lui-même est structuré par la formation d'îlots de même biais d'usage des codons, et que ces îlots sont très grands (30 gènes chez E. coli ; 150 gènes chez B. subtilis) ; ce travail montre que l'organisation génomique bactérienne est contrainte par le processus de traduction :

Bailly-Bechet M, Danchin A, Iqbal M, Marsili M, Vergassola M
Codon usage domains over bacterial chromosomes
PLoS Comput Biol  (2006), 2:e37.

• Découverte de la présence massive de gènes à fonction inconnue chez les bactéries, 1991, et premier séquençage et annotation du génome d'une bactérie de la classe des Firmicutes, 1997

La mise en œuvre du séquençage du génome de Bacillus subtilis, premier programme de ce type lancé pour des raisons conceptuelles et non technologiques et proposé par AD début 1987, a permis, en parallèle avec le même résultat obtenu par le consortium du projet Saccharomyces cerevisiae, à la première grande découverte de la génomique démontrant que bien des gènes étaient totalement inconnus, tant par leur séquence, que par leur fonction ou la structure de leur produit :

P Glaser, F Kunst, M Arnaud, M-P Coudart, W Gonzales, M-F Hullo, M Ionescu, B Lubochinsky, L Marcelino, I Moszer, E Presecan, M Santana, E Schneider, J Schweizer, A Vertes, G Rapoport, A Danchin
Bacillus subtilis genome project: cloning and sequencing of the 97 Kb region from 325o to 333o
Mol Microbiol (1993) 10: 371-384 pubmed [
il est amusant de remarquer que cet article se trouve dans PubMed avec une liste d'auteurs tronquée : les biologistes n'avaient pas, alors, l'habitude des longues listes d'auteurs communes en physique]

Cet article montre, pour la première fois, que dans un long fragment génomique séquencé entièrement, la moitié des gènes ne ressemble à rien de connu jusqu'alors. Ce résultat totalement inattendu (les adversaires des projets de séquençage des génomes avaient “démontré” que nous connaissions au moins 95% des classes possibles de gènes et publié cette démonstration dans les journaux les plus en vue), présenté au premier symposium de génomique organisé par l'Union Européenne à Elounda en Crète, en 1991, marquait la première découverte majeure issue des programmes de séquençage des génomes.

Réalisé par un consortium réunissant l'Europe et le Japon, le séquençage du génome de B. subtilis était achevé en 1997, en même temps que celui du génome de E. coli. Dès 1995 la longueur des fragments continus du génome de l'organisme dépassait largement la longueur totale des génomes complets séquencés par Craig Venter et ses collègues. Bien peu, en face d'une offensive publicitaire sans précédent et désormais courante en biologie, le remarqueront. Ce génome restera aussi pendant cinq ans le seul de son type (les génomes des Firmicutes sont particulièrement difficiles à séquencer, parce que son ADN est toxique dans l'hôte utilisé pour le séquençage, E. coli, pour des raisons biochimiques bien établies par les auteurs du projet) :

F Kunst, N Ogasawara, I Moszer, AM Albertini, G Alloni, V Azevedo, MG Bertero, P Bessières, A Bolotin, S Borchert, R Borriss, L Boursier, A Brans, M Braun, SC Brignell, S Bron, S Brouillet, CV Bruschi, B Caldwell, V Capuano, NM Carter, SK Choi, JJ Codani, IF Connerton, NJ Cummings, RA Daniel, F Denizot, KM Devine, A Düsterhöft, SD Ehrlich, PT Emmerson, KD Entian, J Errington, C Fabret, E Ferrari, D Foulger, C Fritz, M Fujita, Y Fujita, S Fuma, A Galizzi, N Galleron, SY Ghim, P Glaser, A Goffeau, EJ Golightly, G Grandi, G Guiseppi, BJ Guy, K Haga, J Haiech, CR Harwood, A Hénaut, H Hilbert, S Holsappel, S Hosono, MF Hullo, M Itaya, L Jones, B Joris, D Karamata, Y Kasahara, M Klaerr-Blanchard, C Klein, Y Kobayashi, P Koetter, G Koningstein, S Krogh, M Kumano, K Kurita, A Lapidus, S Lardinois, J Lauber, V Lazarevic, SM Lee, A Levine, H Liu, S Masuda, C Mauël, C Médigue, N Medina, RP Mellado, M Mizuno, D Moesti, S Nakai, M Noback, D Noone, M O'Reilly, K Ogawa, A Ogiwara, B Oudega, SH Park, V Parro, TM Pohl, D Portetelle, S Porwollik, AM Prescott, E Presecan, P Pujic, B purnelle, G Rapoport, M Rey, S Reynolds, M Rieger, C Rivolta, E Rocha, B Roche, M Rose, Y Sadaie, T Sato, E Scalan, S Schleich, R Schroeter, F Scoffone, J Sekiguchi, A Sekowska, SJ Seror, P Serror, BS Shin, B Soldo, A Sorokin, E Tacconi, T Takagi, H Takahashi, K Takemaru, M Takeuchi, A Tamakoshi, T Tanaka, P Terpstra, A Tognoni, V Tosato, S Uchiyama, M Vandenbol, F Vannier, A Vassarotti, A Viari, R Wambutt, E Wedler, T Weitzenegger, P Winters, A Wipat, H Yamamoto, K Yamane, K Yasumoto, K Yata, K Yoshida, HF Yoshikawa, E Zumstein, H Yoshikawa, A Danchin
The complete genome sequence of the gram-positive bacterium Bacillus subtilis
Nature (1997) 390: 249-256 pubmed pdf science_watch

La séquence complète de ce génome a été reprise dix ans plus tard, afin d'en corriger les erreurs (la technologie a considérablement évolué) et surtout de mettre à jour les annotations qui décrivent la fonction de tous les gènes :

V Barbe, S Cruveiller, F Kunst, P Lenoble, G Meurice, A Sekowska, D Vallenet, TZ Wang, I Moszer, C Médigue, A Danchin
From a consortium sequence to a unified sequence: The Bacillus subtilis 168 reference genome a decade later
Microbiology (2009) 155: 1758-1775 PubMed biosapiens epgprobactys tarpol pdf


E Belda E, A Sekowska, F Le Fèvre, A Morgat, D Mornico, C Ouzounis, D Vallenet, C Médigue, A Danchin
An updated metabolic view of the Bacillus subtilis 168 genome
Microbiology (2013) 159: 757-770

La mise à la disposition de la communauté internationale des données de séquence d'annotation a été coordonnée par AD, sous la forme d'une structure de bases de données spécialisées d'un usage très général  :

C Médigue, A Viari, A Hénaut, A Danchin
Colibri: a functional data base for the Escherichia coli genome
Microbiol Rev (1993) 57: 623-654
pubmed 

I Moszer, P Glaser, A Danchin
SubtiList: a relational database for the Bacillus subtilis genome
Microbiology (1995) 141 ( Pt 2): 261-268
pubmed

I Moszer, LM Jones, S Moreira, C Fabry, A Danchin
SubtiList: the reference database for the Bacillus subtilis genome
Nucleic Acids Res (2002) 30: 62-65 pubmed

Par la suite AD a participé à ou organisé plusieurs projets de génomique bactérienne : Leptospira interrogans et Staphylococcus epidermidis, en collaboration avec le Centre de génomique de Shanghai, Photorhabdus luminescens, à l'Institut Pasteur, et plus récemment, pour comprendre le rôle de la contrainte imposée par le froid dans l'organisation des génomes, la bactérie Antarctique Pseudoalteromonas haloplanktis TAC125, en collaboration avec le Genoscope et plusieurs universités internationales, puis le génome de la bactérie résistante à l'arsenic Herminiimonas arsenicoxydans et enfin le génome de Psychromonas ingrahamii . En quelques années les progrès technologiques tant in vitro qu'in silico sont extraordinaires, et l'on peut remarquer que ce dernier projet a demandé cent fois moins de travail, en termes d'hommes/années que celui de B. subtilis :

HKU_Pasteur
SX Ren, G Fu, XG Jiang, R Zeng, YG Miao, H Xu, YX Zhang, H Xiong, G Lu, LF Lu, HQ Jiang, J Jia, YF Tu, JX Jiang, WY Gu, YQ Zhang, Z Cai, HH Sheng, HF Yin, Y Zhang, GF Zhu, M Wan, HL Huang, Z Qian, SY Wang, W Ma, ZJ Yao, Y Shen, BQ Qiang, QC Xia, XK Guo, A Danchin, I Saint Girons, RL Somerville, YM Wen, MH Shi, Z Chen, JG Xu, GP Zhao
Unique physiological and pathogenic features of Leptospira interrogans revealed by whole-genome sequencing
Nature (2003) 422: 888-893 pubmed pdf

 

HKU_Pasteur
YQ Zhang, SX Ren, HL Li, YX Wang, G Fu, J Yang, ZQ Qin, YG Miao, WY Wang, RS Chen, Y Shen, Z Chen, ZH Yuan, GP Zhao, D Qu, A Danchin, YM Wen
Genome-based analysis of virulence genes in a non-biofilm-forming Staphylococcus epidermidis strain (ATCC 12228)
Mol Microbiol (2003) 49: 1577-1593 pubmed pdf

E Duchaud, C Rusniok, L Frangeul, C Buchrieser, A Givaudan, S Taourit, S Bocs, C Boursaux-Eude, M Chandler, JF Charles, E Dassa, R Derose, S Derzelle, G Freyssinet, S Gaudriault, C Médigue, A Lanois, K Powell, P Siguier, R Vincent, V Wingate, M Zouine, P Glaser, N Boemare, A Danchin, F Kunst
The genome sequence of the entomopathogenic bacterium Photorhabdus luminescens
Nature Biotechnol (2003) 21: 1307-1313
pubmed pdf

C Médigue, E Krin, G Pascal, V Barbe, A Bernsel, PN Bertin, F Cheung, S Cruveiller, S D'Amico, A Duilio, G Fang, G Feller, C Ho, S Mangenot, G Marino, J Nilsson, E Parrilli, EPC Rocha, Z Rouy, A Sekowska, ML Tutino, D Vallenet, G von Heijne, A Danchin
Coping with cold: the genome of the versatile marine Antarctica bacterium Pseudoalteromonas haloplanktis TAC125
Genome Res (2005) 15: 1325-1335
PubMed GR

D Muller, C Medigue, S Koechler,V Barbe, M Barakat, E Talla, V Bonnefoy, E Krin, F Arsene-Ploetze, C Carapito, M Chandler, B Cournoyer, S Cruveiller, C Dossat, S Duval, M Heymann, E Leize, A Lieutaud, D Lievremont, Y Makita, S Mangenot, W Nitschke, P Ortet, N Perdrial, B Schoepp, P Siguier, DD Simeonova, Z Rouy, B Segurens, E Turlin, D Vallenet, A Van Dorsselaer, S Weiss, J Weissenbach, MC Lett, A Danchin, PN Bertin
A tale of two oxidation states: bacterial colonization of arsenic-rich environments
PLoS Genetics (2007) 3: e53 PubMed codon usage

M Riley, JT Staley, A Danchin, TZ Wang, TS Brettin, LJ Hauser, ML Land, LS Thompson
Genomics of an extreme psychrophile, Psychromonas ingrahamii
BMC Genomics (2008) 9: 210
 PubMed  BMC HA F1000

Les données correspondantes sont organisées, avec celles d'un grand nombre de bactéries d'intérêt médical ou environnemental, à l'Université de Hong Kong :

HKU_Pasteur
G Fang, C Ho, YW Qiu, V Cubas, Z Yu, C Cabau, F Cheung, I Moszer, A Danchin
Specialized microbial databases for inductive exploration of microbial genome sequences 
BMC Genomics (2005) 6: 14 pubmed BMC

Découverte des premières grandes lois de l'organisation des génomes bactériens 1999-présent

Il s'agit là du cœur même de la recherche menée par AD depuis une vingtaine d'années : peut-on trouver des lois dans l'organisation des gènes dans le génomes bactériens ? Plusieurs grandes lois ont été découvertes : d'une part, il existe un biais universel dans la composition des gènes présents sur le brin direct et le brin complémentaire de l'ADN ; d'autre part, et c'est un résultat remarquable, les gènes essentiels (identifiés expérimentalement dans la suite du programme de séquençage de B. subtilis) se trouvent spécifiquement codés par le brin direct de l'ADN. Par ailleurs ses travaux actuels lui ont permis d'établir des règles universelles dans l'organisation des génomes bactériens (motifs « flous » ubiquistes, répartition des gènes dans les brins directs et complémentaires, localisation des gènes essentiels, formation d'îlots de même biais d'usage du code génétique, etc) et dans la genèse des protéines (découverte d'une caractéristique essentielle des protéines « orphelines » et hypothèse de l'existence de protéines de stabilisation des édifices multimériques, les « gluons ») : 

EPC Rocha, A Danchin, A Viari
Universal replication biases in bacteria
Mol Microbiol (1999) 32: 11-16
pubmed pdf

A Danchin, P Guerdoux-Jamet, I Moszer, P Nitschké
Mapping the bacterial cell architecture into the chromosome
Philos Trans R Soc Lond B Biol Sci (2000) 355: 179-190
pubmed pdf

HKU_Pasteur
EPC Rocha, A Danchin
Ongoing evolution of strand composition in bacterial genomes
Mol Biol Evol (2001) 18: 1789-1799 pubmed pdf
HKU_Pasteur
EPC Rocha, A Danchin
Essentiality, not expressiveness, drives gene-strand bias in bacteria
Nature Genetics (2003) 34: 377-378 pubmed pdf
HKU_Pasteur
EPC Rocha, A Danchin
Gene essentiality determines chromosome organisation in bacteria
Nucleic Acids Res (2003) 31: 6570-6577 pubmed

Considérant les génomes dans leur globalité, on connaissait depuis longtemps la présence d'un biais périodique de période 10-11,5 dans la répartition des nucléotides, des procaryotes jusqu'aux eucaryotes. Ce biais est présent aussi bien dans les régions codant des protéines que dans les autres. Une analyse statistique soigneuse, fondée sur la comparaison entre le génome réel et un génome "réaliste" (comportant toute la connaissance accumulée à son propos) a révélé la présence ubiquiste de "motifs flexibles de classe A". Chaque motif contient jusqu'à une dizaine de nucléotides conservés répartis de façon discontinue, dans une région dont la longueur peut atteindre 70 paires de bases. L'originalité de leur découverte vient de ce qu'ils sont "flexibles", en cela que la position exacte des nucléotides conservés dans deux motifs peut varie d'une à deux paire de bases. C'est cette fluctuation, due à la composition locale de l'ADN et à son degré de surenroulement, qui avait rendu ces motifs invisibles jusqu'à présent. Leur densité est telle qu'ils recouvrent jusqu'à la moitié du génome. Leur structure suggère qu'ils définissent un réseau très dense d'interaction avec des protéines  :

HKU_Pasteur
E Larsabal, A Danchin
Genomes are covered with ubiquitous 11bp periodic patterns, the "class A flexible patterns"
BMC Bioinformatics (2005) 6: 206 pubmed BMC

Les contraintes correspondantes se manifestent dans les protéines, au point que leur composition en acides aminés est plus affectée par l'organisation du génome et celle du métabolisme que par leur fonction. Ces résultats nouveaux ont des implications considérables quant aux méthodes d'analyse phylogénétique lorsqu'on étudie les séquences protéiques :

HKU_Pasteur
EPC Rocha, A Danchin
Base composition bias might result from competition for metabolic resources
Trends Genet (2002) 18: 291-294 pubmed pdf
HKU_Pasteur
G Pascal, C Médigue, A Danchin
Universal biases in protein composition of model prokaryotes
Proteins (2005) 60: 27-35 PubMed

G Pascal, C Médigue, A Danchin
Persistent biases in the amino-acid composition of prokaryotic proteins
Bioessays (2006) 28: 726-738
PubMed pdf  biosapiens b7

Ces derniers travaux caractérisent les protéines “orphelines” qui forment environ 10% des protéines de tout génome d'une nouvelle espèce par leur richesse en acides aminés aromatiques, et propose que nombre d'entre elles représentent le “soi” de l'espèce, en se comportant comme des “gluons” apportant une stabilité supplémentaire aux complexes multiprotéiques de la cellule. Il s'agirait là d'une contribution essentielle à la stabilisation fonctionnelle des structures intracellulaires complexes. Plus généralement l'approche développée permet de définir ce qu'est l'essentialité d'un gène par sa persistance dans de nombreuses espèces non seulement en séquence mais en position dans le génome  :

G Fang, EPC Rocha, A Danchin
How essential are non-essential genes?
Mol Biol Evol (2005) 22: 2147-2156 PubMed 

Ainsi il apparaît que les génomes bactériens sont hautement organisés, au contraire de l'idée fort répandue d'une "fluidité" génomique essentielle. Mais quelles peuvent être les pressions de sélection conduisant à cette organisation ?

Une première estimation, conduit à montrer que, chez les bactéries, la traduction organise la répartition des gènes dans le chromosome

M Bailly-Bechet, A Danchin, M Iqbal, M Marsili, M Vergassola
Codon usage domains over bacterial chromosomes
PLoS Computational Biology (2006) 2: [e37]
PubMed codon usage

Connaissant les gènes persistants chez les bactéries, nous avons exploré la façon dont ils restent rassemblés au cours de l'évolution. Le résultat de cette étude donne une image fascinante de l'organisation des génomes, où l'on découvre que les gènes du cœur des génomes, les plus anciens, ont évolué selon un schéma qui illustrerait parfaitement un scénario de l'origine de la vie. J'ai pour cette raison appelé cet ensemble le paléome :

A Danchin, G Fang, S Noria
The extant core bacterial proteome is an archive of the origin of life
Proteomics (2007) 7: 875-889 PubMed biosapiens b7 epg

En parallèle avec cet ensemble qui permet la vie, un autre ensemble, que j'ai nommé le cénome, permet l'occupation d'une niche particulière, et ce sont les gènes correspondants qui s'échangent par transfert horizontal :

A Danchin
Archives or palimpsests? Bacterial genomes unveil a scenario for the origin of life
Biological Theory (2007) 2: 52-61 b7

CG Acevedo-Rocha, G Fang, M Schmidt, DW Ussery, A Danchin
From essential to persistent genes: a functional approach to constructing synthetic life
Trends Genet (2013) 29: 273-279

Ainsi, ce que nous savons des bactéries nous donne une image du plan de construction de ce qui serait une cellule synthétique, si l'on débarrasse les génomes connus de tous leurs appendices inutiles. En bref, un ensemble de gènes persistants, le paléome, définit les programmes du réplicateur et du constructeur, en y ajoutant un ensemble de gènes importants pour la capture de l'information. Bien sûr, le programme génétique n'est pas une abstraction. Il est porté par une molécule particulière, l'ADN, contrainte par les lois de la physique et de la chimie. Un génome est un polymère qui occuperait un volume dont le rayon serait dix fois celui du volume réellement occupé dans la cellule. Saurons-nous comprendre les règles de l'organisation de l'ADN ? Une première analyse des mots « flous » dans les génomes en donne une idée. Mais la réflexion doit se poursuivre pour nous permettre l'aventure prométhéenne de la biologie synthétique, et il faut en particulier comprendre comment la machinerie de l'expression des gènes trouve aussi sa place dans la cellule. Les lois les plus simples de la physique, comme l'accroissement inéluctable de l'entropie, loin d'être un facteur défavorable à l'entreprise, est en fait une force qui, une fois domestiquée, fournit le moteur du fonctionnement cellulaire. Quelques règles du développement de la vie « en contexte » permettent de comprendre comment nous pourrons un jour faire en sorte que des cellules synthétiques produisent ce que nous attendons d'elles.

• Identification de quelques grands principes métaboliques et physico-chimiques responsables de la stabilisation sélective de la structure des génomes bactériens; découverte du métabolisme paralogue

L'organisation fonctionnelle des gènes dans le génome doit resulter de la pression de sélection due à des principes physico-chimiques simples. Outre les causes physiques comme la structure de l'eau (dont l'étude commence avec celle du génome de P. haloplanktis mentionnée plus haut), AD a fait la conjecture simple que les gaz et les radicaux libres, en raison de leur extrême facilité de diffusion, jouent certainement un rôle de premier plan dans la compartimentation cellulaire, et pourraient donc être à l'origine d'une partie de l'organisation des gènes correspondants au sein du génome. Le métabolisme de l'atome de soufre étant particulièrement sensible à ces gaz et radicaux, il est important d'en comprendre la nature et la structuration. Une première étude a montré l'organisation en îlots du métabolisme du soufre :

EPC Rocha, A Sekowska, A Danchin
Sulphur islands in the Escherichia coli genome: markers of the cell's architecture?
FEBS Lett (2000) 476: 8-11 pubmed pdf

et une analyse détaillée, principalement réalisée avec ses collègues lors de la création du HKU-Pasteur Research Centre à Hong Kong a permis de découvrir l'ensemble des détails génétiques d'une voie métabolique jusque là largement ignorée, celle de la récupération de la méthionine (“methionine salvage pathway”) :

HKU_Pasteur
A Sekowska, HF Kung, A Danchin
Sulfur metabolism in Escherichia coli and related bacteria: facts and fiction
J Mol Microbiol Biotechnol (2000) 2: 145-177 pubmed pdf

A Sekowska, JY Coppée, JP Le Caer, I Martin-Verstraete, A Danchin
S-adenosylmethionine decarboxylase of Bacillus subtilis is closely related to archaebacterial counterparts
Mol Microbiol (2000) 36: 1135-1147 pubmed pdf

HKU_Pasteur
A Sekowska, L Mulard, S Krogh, JK Tse, A Danchin
MtnK, methylthioribose kinase, is a starvation-induced protein in Bacillus subtilis
BMC Microbiol (2001) 1: 15 pubmed BMC
HKU_Pasteur
A Sekowska, S Robin, JJ Daudin, A Hénaut, A Danchin
Extracting biological information from DNA arrays: an unexpected link between arginine and methionine metabolism in Bacillus subtilis
Genome Biol (2001) 2: RESEARCH0019 pubmed genomebiology
HKU_Pasteur
A Sekowska, A Danchin
The methionine salvage pathway in Bacillus subtilis
BMC Microbiol (2002) 2: 8 pubmed BMC 

Un dernier travail fait la synthèse des activités catalytiques impliquées dans ce cycle ubiquiste (il est aussi présent chez l'homme et chez les plantes) dont une particularité est qu'il recrute systématiquement des protéines de structures diverses pour conduire à la réalisation du cycle complet. L'une de ces protéines est très probablement l'ancêtre de la ribulose-phosphate carboxylase/oxygénase (RuBisCO), l'enzyme la plus abondante de la planète (cela ouvre de fascinantes questions sur l'origine des fonctions enzymatiques)  :

HKU_Pasteur
A Sekowska, V Dénervaud, H Ashida, K Michoud, D Haas, A Yokota, A Danchin
Bacterial variations on the methionine salvage pathway
BMC Microbiol (2004) 4: 9 pubmed BMC

H Ashida, A Danchin, A Yokota
Was photosynthetic RuBisCO recruited by acquisitive evolution from RuBisCO-like proteins involved in sulfur metabolism?
Res Microbiol (2005) 156: 611-618 PubMed pdf

Ce cycle très original a la particularité de conduire dans certaines conditions, comme cela est montré dans ce travail, à la production de monoxyde de carbone. Comme ce cycle existe chez l'homme, cela ouvre des perspectives intéressantes sur la possibilité de nouveaux contrôles par CO, médiateur gazeux différent de l'oxyde d'azote dans le système immunitaire ou le système nerveux.

CM Chan, A Danchin, P Marlière, A Sekowska
Paralogous metabolism: S-alkyl-cysteine degradation in Bacillus subtilis.
Environ Microbiol (2013) Jul 16. doi: 10.1111/1462-2920.12210. pubmed

• Stabilisation sélective et épigenèse

Ainsi s'ouvre la recherche des causes sélectives de l'organisation de l'architecture génomique, retrouvant les premiers travaux menés pas AD sur la mémoire et l'apprentissage dans le système nerveux et le système immunitaire.

JP Changeux, P Courrège, A Danchin
A theory of the epigenesis of neuronal networks by selective stabilization of synapses
Proc Natl Acad Sci U S A (1973) 70: 2974-2978 pubmed pnas pdf

A Danchin, JP Changeux
Apprendre par stabilisation sélective de synapses en développement
In: "L'Unité de l'Homme" (Centre Royaumont pour une Science de l'Homme) Le Seuil (1974): 320-350

JP Changeux, A Danchin
Selective stabilisation of developing synapses as a mechanism for the specification of neuronal networks
Nature (1976) 264: 705-712 pubmed

A Danchin
A selective theory for the epigenetic specification of the monospecific antibody production in single cell lines
Ann Immunol (Paris) (1976) 127: 787-804 pubmed

A Danchin
Stabilisation fonctionnelle et épigenèse: une approche biologique de la genèse de l'identité individuelle
In: "L'Identité" (JM Benoist, ed) Grasset (1977): 185-221 pdf (1.7 Mo)

A Danchin
The specification of the immune response: a general selective model
Mol Immunol (1979) 16: 515-526 pubmed

JP Changeux, P Courrège, A Danchin, JM Lasry
Un mécanisme biochimique pour l'épigenèse de la jonction neuro-musculaire
C R Séances Acad Sci III (1981) 292: 449-453 pubmed

Il reste désormais à comprendre comment s'organise le devenir des cellules filles au moment de la division cellulaire et quels sont les principes de stabilisation sélective à l'œuvre...

• Biologie Synthétique

La biologie nous concerne tellement que nous n’y prenons garde. La biologie doit donc faire sa révolution copernicienne, et oublier de croire que la vie est au centre du monde. Cela nous replace dans le réel, celui qu’explore, par exemple, la physique. Matière, énergie, espace, temps, sont les quatre catégories usuelles de la nature. Mais la biologie s’en accommode mal. Peu de matière et d’énergie, un peu d’espace, un peu de temps et pourtant, si le lecteur me suit jusqu’ici, c’est que quelque chose se passe en lui. Faute de trouver un meilleur mot, j’emploie celui du tout venant. Nous sommes, en ce moment même où vous me lisez, en train d’échanger de l’information. Ma proposition est que ce que nous allons devoir développer est la conjecture que cette ’information’, encore bien mal définie (voici un travail à faire), est une authentique catégorie de la nature, à l’instar des quatre catégories standards. Cette conjecture a de très fortes implications. Elles changent complètement la place de la biologie dans les sciences, en la plaçant très près de la mathématique. L’analyse des génomes, celle que j’ai nommée in silico il y a de près de vingt ans devient alors un pan essentiel de l’étude de la vie.

Mais, en bref, la conséquence la plus importante de cette façon de voir est que ce que nous appelons sélection naturelle devient un principe de la physique. C’est le principe qui consiste à faire de la place en utilisant de l’énergie, non pour détruire, mais pour éviter de détruire ce qui est riche en information (fonctionnel). Les organismes vivants apparaissent alors comme des pièges à information. Et cela explique l’apparente orientation de la vie vers une complexité (ce mot est très ambigu, mais gardons-le dans son sens intuitif) toujours croissante. La création est non dans le passé, mais continue. Il y a une sorte d’accrétion de l’information autour des organismes vivants. Cela a des conséquences éthiques considérables: si l’on donne de la valeur à l’information, alors il faut tenter de lui laisser le plus possible de pistes pour s’accumuler. C’est une profonde justification de la diversité biologique. Et cela va contre l’explosion démographique actuelle de l’homme . Incidemment se pose une question, tout à fait non résolue, celle de l’existence d’un principe de conservation: l’information, dans sa totalité, se conserve-t-elle ? Dans l’affirmative cela voudrait dire que si elle s’accumule quelque part, elle s’appauvrit ailleurs. Mais il y a bien d’autres hypothèses possibles (comme c’était le cas, déjà, dans les relations entre matière et énergie).

Ma position personnelle est que nous devrions tenter de suivre le principe indiqué plus haut, à savoir, utiliser toute l’énergie dont nous disposons pour éviter de détruire ce qui est riche en information. L’idée centrale pour le biologiste — généticien — que je suis, est qu’il faut désormais associer autant de chercheurs en biologie in silico qu’en biologie in vivo ou in vitro. Cela signifie aussi qu’il faut valoriser l’échange entre physique, mathématique et biologie. Cela signifie qu’il faut revaloriser le statut de la mathématique et de la biologie, en les associant le plus souvent possible l’une à l’autre. Curieusement, dans nos systèmes d’enseignement la première est crainte (et donc peu favorisée) et la seconde est ridiculisée (et donc peu favorisée, là encore). Or il me semble que notre avenir dépend, très rapidement, du traitement que nous réserverons à cette façon de voir.

Au centre de cette réflexion apparaît l'idée que ce que nous appelons sélection naturelle est un authentique principe de la physique, qui consiste à "faire de la place" en utilisant de l'énergie pour éviter de détruire ce qui est riche en information, dans le contexte considéré.

Cette façon de voir est au cœur de la reconstruction de la vie ab initio, le projet de la Biologie Synthétique.

LUDUS VITALIS / vol. XVI / num. 30 / 2008 et DELICIOUS PAPER/vol. III/2009


PM Binder, A Danchin
Life's demons: information and order in biology. What subcellular machines gather and process the information necessary to sustain life?
EMBO Reports (2011) 12: 495-499

A Danchin, PM Binder, S Noria
Antifragility and tinkering in biology (and in business): Flexibility provides an efficient epigenetic way to manage risk
Genes (2011), 2: 998-1016; doi:10.3390/genes2040998

M Porcar, A Danchin, V de Lorenzo, VA dos Santos, N Krasnogor, S Rasmussen, A Moya
The ten grand challenges of synthetic life
Systems and Synthetic Biology (2011) 5: 1-9

AD a publié a publié plus de 500 articles (370 référencés par PubMed, et 440 par l'ISI) et quatre ouvrages de philosophie de la biologie moléculaire :

Ordre et Dynamique du Vivant. Chemins de la Biologie Moléculaire - Le Seuil, 1978.

L'Oeuf et la Poule. Histoires du code génétique - Fayard, 1983.
En portugais : O Ovo e a Galina. Historias do Codigo genetico - Relogio d'agua, 1993,
et aussi en japonais.

Une Aurore de Pierres. Aux origines de la vie - Le Seuil, 1990.
En portugais : Uma Aurora de Pedras. Nas origens da vida - Almedina, 1992.

La Barque de Delphes. Ce que révèle le texte des génomes - Odile Jacob -1998

The Delphic Boat. What genomes tell us - Harvard University Press - 2003 [Commentaires dans Nature, Nature Genetics, EMBO Reports]

Le site en Français