Génétique des Génomes Bactériens


Historique de l'Unité Génétique des Génomes Bactériens
(anciennement Régulation de l'Expression Génétique)





Les recherches de l'Unité de Génétique des Génomes Bactériens sont fondées sur l'idée centrale que la cellule n'est pas un micro tube à essais, où les gènes s'expriment simplement en compétition les uns avec les autres, mais qu'il existe un ensemble coordonné d'interactions entre les gènes, leur produits, l'architecture et la dynamique de la cellule. Les principaux modèles utilisés, Escherichia coli K12 et Bacillus subtilis 168, ont été choisis parce qu'ils représentent les organismes unicellulaires procaryotes les mieux connus, mais aussi, bien sûr, pour des raisons historiques (parcours scientifique du responsable de l'Unité).

Le thème central des recherches de l'ancêtre de cette unité, l'Unité de Régulation de l'Expression Génétique créée en 1986, consistait à identifier les régulations mettant en jeu le métabolisme de petites molécules, et qui permet la coordination de l'expression génétique chez Escherichia coli et chez Bacillus subtilis. Les premiers travaux ont mis en évidence l'existence d'une série de hiérarchies métaboliques dont certains effecteurs, comme la sérine, le 2-cétobutyrate ou l'AMP cyclique, jouent un rôle clef dans la coordination des synthèses macromoléculaires. La première molécule joue un rôle de signal intégrateur encore mal compris, mais dont il a été possible de déterminer les cibles de l'action (indirecte probablement) : système des phosphotransférases responsables du transport du glucose et du contrôle de la synthèse de l'AMP cyclique, protéine H-NS, et couplage entre la traduction et la transcription. La seconde intervient lors du passage de l'anaérobiose à l'aérobiose et contrôle, par le biais du système des phosphotransférases qui transportent les sources de carbone, à la fois la perméation au travers de la membrane, les flux métaboliques, et les synthèses macromoléculaires. Il s'agirait donc d'un des médiateurs de l'effet Pasteur. En collaboration étroite avec l'Unité de Biochimie des Régulations Cellulaires, dirigée par A. Ullmann à l'Institut Pasteur (jusqu'en 1996), les travaux de l'Unité de Régulation de l'Expression Génétique ont démontré que l'AMP cyclique contrôle non seulement le démarrage de la transcription de certains opérons (et est ainsi l'un des médiateurs de la répression par le glucose découverte par Jacques Monod) mais aussi la terminaison de la transcription. Cela a permis de découvrir un contrôle, inconnu jusque là, de la coordination de l'expression des opérons polycistroniques par modulation de l'étape de terminaison de la transcription. Curieusement, malgré l'intérêt pour l'AMP cyclique dans le monde entier, personne ne comprend encore complètement les liens qui existent entre l'enzyme qui synthétise cette molécule, l'adénylcyclase, le récepteur de l'AMP cyclique, CAP, la synthèse de l'AMP cyclique et la régulation de l'expression de nombreux opérons chez E. coli. Il s'agit donc d'un thème de recherche qui, malgré son apparence ancienne, reste encore futuriste.

Ces travaux ont conduit les chercheurs de l'Unité à isoler le gène de l'adénylcyclase et de plusieurs des protéines des phosphotransférases chez E. coli, d'abord, puis chez un grand nombre d'autres organismes. Cela a permis de comprendre certains aspects de ces protéines essentielles et de la régulation de leur expression, puis à en développer l'étude comparative. De ce travail il ressort que les adénylcyclases sont en général de grosses protéines et qu'elles constituent quatre classes bien distinctes (la dernière classe, totalement inattendue, a été publiée par les chercheurs de l'Unité en 1998, elle est apparentée à une kinase tout à fait nouvelle et inattendue, la thiamine diphosphate kinase). Chez les entérobactéries et les familles apparentées comme les Vibrio sp., Pasteurella sp., ou les Aeromonas sp., elles sont constituées de deux domaines, le domaine amino-terminal étant seul doué d'activité catalytique. Les cyclases toxiques de deux agents pathogènes très éloignés Bordetella pertussis -- agent de la coqueluche -- et Bacillus anthracis -- agent du charbon --, activées par la calmoduline, et dont le gène a été cloné (en collaboration avec A. Ullmann et M. Mock, respectivement) grâce à une technique originale qui peut être d'un usage très général (clonage à partenaires multiples, antécédent conceptuel de la technique du "double hybride"), forment un groupe à part d'enzymes extrêmement actives, dont les plus fins détails moléculaires ont été étudiés en collaboration avec O. Bârzu et ses collègues (Laboratoire de chimie structurale des macromolécules). Des travaux récents ont découvert des cyclases toxiques apparentées à cette classe chez Pseudomonas aeruginosa, et chez des Yersinia pathogènes (Y. pestis et Y. pseudotuberculosis, travaux non publiés). L'étude de la sécrétion de la cyclase de l'agent de la coqueluche s'est révélée particulièrement fascinante, car elle intègre, via la formation d'une protéine bifonctionnelle, la cyclolysine, à la fois adénylcyclase et hémolysine, un mécanisme de sécrétion original aujourd'hui connu chez plusieurs organismes, et dont le parangon est l'hémolysine pathogène du colibacille. Une troisième classe, ubiquiste et majoritaire dans le monde vivant, a été d'abord identifiée chez la levure, puis chez deux bactéries très distantes Rhizobium meliloti et Brevibacterium liquifaciens (collaborations avec F. O'Gara, Irlande et E. Peters, Grande Bretagne), puis chez des bactéries différenciées, Stigmatella aurantiaca et Streptomyces coelicolor. Cette dernière classe, qui comprend les adényl et guanylcyclases des eucaryotes supérieurs (découvertes ailleurs dans le monde) est antérieure à la séparation phylogénétique des eubactéries et des eucaryotes, et pose donc des problèmes remarquables d'évolution. Ces questions évolutives sont parmi les raisons qui ont conduit l'Unité à s'impliquer dans l'aventure que représentait le séquençage d'un génome bactérien entier. Au moyen d'un crible génétique, il a été possible de faire évoluer la spécificité de l'enzyme de R. meliloti de son substrat ATP vers le GTP, ce qui a permis de découvrir un certain nombre des régions importantes pour l'activité de l'enzyme. Pour finir, une quatrième classe de cyclases, très énigmatique (elle est fortement apparentée à la thiamine diphosphate kinase), et sans doute reliée à des gènes d'archébactéries a été découverte chez Aeromonas hydrophila, et caractérisée dans l'Unité. Il s'agit là d'un cas surprenant de convergence évolutive.

Après une période transitoire où peu de recherches ont été menées sur la protéine H-NS, impliquée dans les contrôles globaux de l'expression des gènes chez E. coli, et dans la virulence des entérobactéries, un groupe de chercheurs de l'Unitése consacre au travers de l'analyse des effets positifs de cette protéine, et non plus négatifs, au mécanisme moléculaire de son influence sur l'expression de certains opérons. En dehors de la découverte que l'absence de ce gène conduit à un phénotype fortement mutateur, où les mutations sont principalement des délétions, les contrôles positifs de l'expression de certains gènes, l'action de H-NS sur l'activité de l'adénylcyclase et son rôle dans l'effet sérine, forment le thème actuel de recherches sur cette intéressante protéine, très étudiée dans le monde, et dont la fonction reste cependant très énigmatique.

L'étude détaillée de groupes de régulations collectives de l'expression des gènes du colibacille a conduit le responsible de l'Unité en 1986, à étudier la faisabilité d'un programme de séquençage du génome total d'une bactérie, cela afin d'en analyser la cohérence, et de comprendre le lien possible entre l'organisation des gènes sur les chromosomes et leur fonction dans la cellule. Une conjonction d'intérêts a alors permis de mettre en forme ce projet, en collaboration avec Raymond Dedonder (alors directeur de l'Institut Pasteur), autour de la génétique de Bacillus subtilis. Entre 1988 et 1997 avec Philippe Glaser, un laboratoire de l'Unité, dédié au séquençage partiellement automatisé de l'ADN, a déterminé la séquence de plus de 300 kilobases de l'ADN du chromosome de B. subtilis, et a créé nombre d'outils nécessaires au séquençage complet du génome correspondant. Le projet général s'est concrétisé sous la forme d'une collaboration internationale, européenne et japonaise, coordonnée par Frank Kunst pour l'Europe, et Naotake Ogasawara pour le Japon. L'Unité a eu en charge la responsabilité scientifique de la collecte et de l'analyse des données de séquençage. La base de données relationnelle créée dans l'Unité, SubtiList, est à la fois utilisable individuellement et accessible par le World Wide Web. Elle constitue une référence pour tous les chercheurs qui s'intéressent aux génomes bactériens, et sa mise à jour (y compris dans l'amélioration de sa structure) est régulière. Son pendant pour E. coli, Colibri, aura désormais les annotations les plus à jour, et sera, en collaboration avec Kenn Rudd (Université de Floride), Mary Berlyn (Université Yale) et Amos Bairoch (Université de Genève) la référence mondiale pour cet organisme. Comme la séquence complète du génome de B. subtilis a été connue au début de l'année 1997, l'activité de ce laboratoire s'est réorientée vers la partie la plus intéressante des projets de séquençage, à savoir l'analyse fonctionnelle de tous les gènes. Une série de bases de données fondées sur le même principe, mais à partir de Logiciels Libres est développé par le programme BIOSUPPORT à Hong Kong.

A la suite de ce succès, Philippe Glaser et Frank Kunst ont été appelé à créer un Laboratoire de Génomique des Microorganismes Pathogènes à l'Institut Pasteur. Par ailleurs, en collaboration avec Alain Hénaut, de l'Université de Versailles Saint- Quentin, et Alain Viari à l'Université Paris VI (Atelier de BioInformatique), aujourd'hui chercheur à l'INRIA à Grenoble, l'Unité a constitué un pôle de recherche permettant le développement des études informatiques liées aux génomes. Cette collaboration s'est concrétisée par la constitution, entre autres structures, d'un Groupement de Recherche, Génomes et Informatique, associant une cinquantaine de chercheurs, dirigé par A. Danchin et F. Rechenmann (1992-1995). Cela a permis de valider la contribution de certains apports de l'Intelligence Artificielle pour l'analyse des séquences d'acides nucléiques et des protéines, de développer de nombreuses méthodes d'analyse et de créer une plateforme, Imagene, intégrant à la fois les objets biologiques issus du séquençage et les méthodes d'analyse associées. L'étude des peptides signaux des protéines sécrétées, au moyen d'une de ces techniques a donné des résultats très intéressants en permettant de créer des descripteurs très précis de ces signaux d'adressage. Par ailleurs, un résultat expérimental acquis dans l'Unité, la comparaison du produit des gènes de protéines impliquées dans la synthèse de la cystéine et du tryptophane a ouvert des perspectives intéressantes sur l'origine de certaines voies métaboliques. Cela justifie un investissement notable en temps de recherche informatique pour l'analyse des séquences, et démontre qu'il existe un lien significatif entre les questions d'origine, de l'origine de la vie en particulier, et ce qu'il est possible de comprendre à partir des génomes actuels. Mais, comme cela a été observé dans le cas du génome de la levure, le résultat sans doute le plus surprenant des premiers travaux qui ont permis la détermination de la séquence du génome de B. subtilis, est que près la moitié des gènes exprimés ne ressemble à rien de connu. Cela démontre que le séquençage des génomes entiers ouvre un nouveau pan de la génétique par la description de gènes pour l'instant tout à fait énigmatiques. Cela justifie particulièrement, par conséquent, un investissement important dans l'exploration de la nature des gènes par des moyens informatiques, et sa validation expérimentale par l'inactivation systématique de tous les gènes de l'organisme et l'analyse des phénotypes correspondants. Les travaux de l'Unité se sont donc spécialisés dans l'analyse comparative de génomes modèles associés à un couple de génomes qui jouent le rôle de révélateurs des séquences pertinentes, comme le fit la Pierre de Rosette pour les hiéroglyphes. Le premier de ces couples concerne des organimsmes à coloration de Gram négative, E. coli et Photorhabdus luminescens. Cette entérobactérie entomopathogène a été choisie en raison de son intérêt biologique (son cycle biologique possède une analogie forte avec celui de l'agent de la peste, Y. pestis), et du fait qu'elle vit dans la nature en cultures pures, c'est à dire dans des conditions qu'on peut transposer en laboratoire. Ce travail est réalisé en collaboration avec Noël Boemare, du Laboratoire de Pathologie comparée à Montpellier, et le laboratoire de Génomique des Microorganismes pathogènes, qui en détermine la séquence complète. Le deuxième couple compare des bactéries à coloration de Gram positive, B. subtilis avec les pathogènes Bacillus anthracis et Bacillus cereus, dont les génomes sont désormais connus. Afin de concentrer les efforts de l'Unité sur un thème commun, reliant les diverses activités de recherche développées jusque là, les chemins métaboliques privilégiés sont ceux qui concernent le métabolisme du soufre, et le métabolisme, qui lui est relié, des polyamines. Le résultat principal de ces études a été de remarquer que l'ordre des gènes dans le chromosome n'est pas aléatoire. Afin de généraliser cette observation et d'en comprendre la raison d'être les travaux actuels de l'Unité se sont orientés vers l'exploration, par génomique soustractive, de l'organisation des génomes de bactéries vivant dans des milieux inhabituels. Certains aspects centraux du métabolisme (métabolisme du soufre, des gaz et des radicaux) perçus comme organisateurs, sont étudiés en priorité. Une des premières retombées de ces travaux est la découverte de nouvelles voies métaboliques, dont certaines ouvrent des perspectives intéressantes pour la création de nouveaux antimicrobiens.

Un aspect spécifique de l'activité du responsable de l'Unité concerne la réflexion épistémologique, l'éthique et la communication du savoir (cf. Antoine Danchin). Cela a été, entre autres, concrétisé par un premier livre sur la Biologie Moléculaire paru en 1978, un second livre, consacré au Code Génétique, L'Oeuf et la Poule, est paru en 1983. Un troisième livre, Une Aurore de Pierres, paru fin 1990, tente d'éclairer de façon nouvelle la question des origines, en la reliant aux projets actuels de séquençage de génomes entiers. Un quatrième livre, enfin, La Barque de Delphes, traite de ce que dit le texte des génomes. Ce dernier livre a été traduit et adapté à la lecture — tout à fait différente de celle du monde gréco-latin — d'un public anglo-américain, The Delphic Boat, à Harvard University Press. Un aspect important de cette réflexion concerne l'originalité des organismes vivants, qu'on peut considérer à la fois comme déterminés et imprévisibles. La métaphore alphabétique du programme génétique permet de comprendre cet apparent paradoxe, et ouvre des perspectives tout à fait nouvelle sur l'évolution. D'une façon générale la position épistémologique défendue, tout en insistant sur l'importance primordiale de l'expérience, se veut assez éloignée de l'empirisme radical anglo-saxon et choisit de développer certains aspects de la tradition scientifique grecque, plus orientée vers la recherche d'explications que vers la simple collection des faits. C'est cette approche particulière des questions scientifiques qui a conduit le responsible de l'Unité à tenter l'aventure de la création d'un centre de recherche à Hong Kong, le Hong Kong University Pasteur Research Centre, fondation à but non lucratif, qui associe des travaux pilotés par l'Institut Pasteur et ses partenaires français publics à l'expertise de la plus ancienne des Universités hongkongaises, la Hong Kong University.




Accueil

Personnel

Organisation

Résumé de l'activité

Publications

Bases de données