Antoine Danchin : Génétique des Génomes Bactériens

Mais l'esprit de l'Homme est borné, & se trouve comme accablé sous cette multitude prodigieuse d'individus de toute espèce, dont les modèles se rangent sans confusion dans une intelligence infinie, parmi ceux de toutes les créatures possibles. Aussi n'a-t-on trouvé jusqu'ici d'autre moyen pour parvenir à bien connaître le tableau de l'Univers, que de le diviser, d'y tracer par-tout des lignes de séparation, & de déplacer même par l'imagination, les parties qui le composent, pour les soumettre à des arrangements méthodiques & proportionnés aux limites de nos conceptions. De-là ces distributions de plantes par classes, par familles, par genres, &c., de-là, en un mot, ces nombreux systêmes qui ont tant exercé la sagacité de l'esprit humain, mais qui ne sont au fond qu'un aveu de sa foiblesse, déguisé sous un appareil important et scientifique.

Chevalier J-B de LAMARCK

Table des Matières

Curriculum vitae
Avant propos
I. Les objets de la biologie moléculaire vus au travers de la physico-chimie des macromolecules
II. La coordination de l'expression génétique
III. Biologie théorique
IV. Science et société
V. Génétique des génomes bactériens
VI. Création d'AMAbiotics
Conclusion

Textes complémentaires

Une vue générale des philosophies présocratiques
Un scénario de l'origine de la vie
Une Aurore de Pierres : aux origines de la vie

V. Génétique des génomes bactériens

Après quatorze années d'activité de l'Unité de Régulation de l'Expression Génétique (REG), nous pouvions enfin avoir accès à la séquence de génomes entiers. Il devenait possible d'explorer la conjecture à l'origine du programme qui nous avait occupé si longtemps : y a-t-il un lien entre l'organisation du génome et l'architecture de la cellule.

Il m'a donc semblé important de renouveler complètement l'activité de mon laboratoire, en me soumettant moi-même aux contraintes fortes d'un changement complet d'environnement, d'une part, et en commençant à valoriser l'énorme travail de séquençage génomique auquel nous nous étions astreints pendant dix ans, d'autre part. Nous avions en effet valorisé le travail de séquençage des génomes bactériens par deux contributions majeures à la biologie contemporaine. D'une part, en 1991 nous découvrions chez Bacillus subtilis, en parallèle avec le travail du programme de séquençage du génome de la levure Saccharomyces cerevisiae, que la moitié des séquences de génes identifiés par séquençage ne ressemblait à rien de connu. D'autre part nous étions les premiers au monde à mettre en évidence une contribution majeure du transfert génétique horizontal, jusque là perçu comme anecdotique, dans la genèse, l'organisation et l'évolution des génomes.
HKU
J'ai donc créé le HKU-Pasteur Research Centre (dont on trouvera un résumé de l'activité durant mon séjour en Chine) à la Faculté de Médecine de l'Université de Hong Kong , et organisé la recherche en génomique fonctionnelle au sein d'une nouvelle unité de recherche, l'Unité de Génétique des Génomes Bactériens formée d'un personnel presque entièrement renouvelé. Le changement de la direction de l'Institut Pasteur au début de l'année 2000 avait conduit à une modification substantielle de la structure des Départements de l'Institut et incité ses chercheurs à une forte mobilité. Nous avons profité de cette création d'une unité nouvelle pour recruter Anne-Marie Gilles qui se trouvait disponible à la fermeture de l'Unité dirigée par Octavian Barzu, et qui développait une approche biochimique complémentaire de la nôtre. Par ailleurs, nous avons redéployé nos études in silico, sous la direction d'Eduardo Rocha en particulier, après l'essaimage réussi de Claudine Médigue (au Génoscope) et d'Ivan Moszer (à la plateforme technologique n°4 de la Génopole de l'Institut Pasteur de Paris).

Cette nouvelle organisation nous a permis de mettre en place de nouvelles collaborations en lançant un nouveau programme de génomique, qui étudiait la bactérie Antarctique Pseudoalteromonas haloplanktis TAC125. Enfin, nous avons recruté un entomologiste spécialiste des toxines bactériennes, Jean-François Charles, pour prendre en compte cet aspect de l'environnement naturel de P. luminescens, pour lequel nous n'avions aucun compétence dans le laboratoire et pour nous permettre d'avancer dans l'exploration de la dichotomie paléome (cœur du génome) / cénome (occupation d'une niche écologique).

1. Premiers universaux dans l'analyse des génomes bactériens

Les travaux de l'Unité GGB, membre de l'URA 2171 du CNRS, ont donc été fondés sur le projet de toute une vie de recherche, celui de comprendre comment les gènes bactériens fonctionnent collectivement. Nous avons vu au Chapitre II comment j'ai abordé cette question par la génétique classique et découvert toute une série de liens fonctionnels entre le métabolisme de certains acides aminés (sérine et acides aminés branchés), le couplage entre transcription et traduction, le contrôle de l'expression génétique par l'AMP cyclique et son récepteur, et la protéine H-NS. Tout cela restait un tissu d'interactions sans grande cohérence apparente, même si elles se retrouvent toujours associées. Or la possibilité de séquencer de grands fragments d'ADN pouvait renouveler la question, en l'abordant dans l'autre sens : non par le phénotype, mais par le génotype directement, en déterminant la séquence des génomes. C'est à cette fin que j'ai conçu, en 1986, le projet de séquencer le génome d'une bactérie en entier, et proposé l'année suivante la mise en place du projet de séquençage du génome de Bacillus subtilis (les raisons scientifiques de ce projet et les péripéties de sa mise en œuvre sont détaillées dans La Barque de Delphes, et son avatar (le texte anglais n'est pas identique au texte français) destiné à un public anglo-américain The Delphic Boat. What genomes tell us, Harvard University Press, 2003).

L'accomplissement de ce projet aura duré dix ans et a constitué l'objectif majeur des travaux de l'Unité REG, close fin 2000. L'Unité assurait la coordination scientifique du programme, au sein d'un consortium associant l'Europe et le Japon (puis marginalement deux laboratoires américains et un laboratoire coréen), via la mise à disposition de la communauté internationale de l'ensemble des résultats du séquençage entre 1986 et 1998, et grâce au soutien d'une série de contrats financés par l'Union Européenne. La création de la nouvelle Unité GGB visait à exploiter la mine d'information que représente la connaissance complète des génomes avec un objectif précis, constitué peu à peu au cours du programme de séquençage, celui de comprendre le lien qui existe entre l'architecture des génomes et l'architecture cellulaire. Et pour finir, parce que nous avions conscience que les technologies utilisées durant ce programme de séquençage d'un génome entier étaient sujettes à la production d'erreurs nous avons entrepris, dix ans plus tard de reséquencer et de réannoter le génome de Bacillus subtilis. La séquence aujourd'hui déposée à l'INSDC est une séquence de référence, dont on peut considérer qu'elle représente sans erreurs la séquence d'un isolat spécifique de la souche 168.

Ce lien architectural repose sur une conjecture simple, qui fait l'hypothèse qu'en première approximation il est possible de considérer les cellules comme organisant des procédures algorithmiques, et sont en quelque sorte des Machines de Turing (ou plutôt leur instanciation concrète sous la forme d'ordinateurs). Mais comme ces Machines de Turing produisent des machines semblables, elles ont à faire face à un paradoxe noté par von Neumann, qui leur impose d'organiser un "réplicateur" et un "constructeur" porteur quelque part d'une image de la machine. Il est donc naturel de rechercher si cette image ne se trouve pas dans le génome lui-même. L'objectif des travaux de l'Unité est d'explorer cette hypothèse en combinant systématiquement des expériences in vivo et in silico (terme que j'ai proposé en 1988 pour justifier auprès de la commission des Communautés Européennes à la demande d'André Goffeau la nécessité d'une infrastructure forte en informatique pour accompagner tous les programmes de séquençage génomique). Nous entrions donc dans une nouvelle génétique, la génétique des génomes.

Afin d'avoir accès à ce lien entre organisation cellulaire et organisation du génome, nous avons entrepris une étude associant l'analyse génomique in silico (où nous recherchons les points fixes, au sein d'un génome que l'évolution rend nécessairement versatile) et l'analyse d'un métabolisme particulier, le métabolisme du soufre. J'ai aussi décidé d'explorer le rôle d'un paramètre physique, la température, dans l'organisation génomique, ce qui nous a conduits à lancer un nouveau programme génome, celui de la bactérie Antarctique Pseudoalteromonas haloplanktis TAC125. Non seulement le froid implique des contraintes fortes dans la structuration des macromolécules, mais l'augmentation de la solubilité des gaz et de la stabilité des radicaux pose des problèmes physico-chimiques redoutables, en particulier à nouveau, à l'atome de soufre. Nous avons choisi d'étudier le métabolisme de cet élément en raison de sa réactivité, qui en fait un lieu de compartimentation systématique. En complément nous avons choisi de participer aux projets de génomique d'organismes fixant l'arsenic, en raison du rôle essentiel du fer et du soufre dans ce processus (GDR 2909, Métabolisme de l'arsenic chez les procaryotes : de la résistance à la détoxication).

1. Recherches 1999-2009 : Paris et Hong Kong (les références font partie de celles publiées par le laboratoire dans le domaine, et durant la période considérée)

Pour tenir compte de cette nouvelle génétique et des changements du personnel correspondant, l'Unité a été temporairement organisée sous forme matricielle en projets scientifiques (activités « verticales »), et en projets technologiques (activités « horizontales »). Cette structure inhabituelle au sein d'un laboratoire, et par construction totalement ouverte et adaptée aux changements thématiques et aux changements de personnel, m'a par ailleurs permis de fonder à Hong Kong le HKU-Pasteur Research Centre, dont l'activité initiale était fortement couplée à celle de l'Unité de façon à créer une masse critique suffisante pour une production scientifique rapide, dans un domaine à créer entièrement (il n'y avait aucune recherche en génomique à Hong Kong à cette époque).

1.1. Génétique des génomes (activités "verticales")

1.1.1. Métabolisme du soufre (Firmicutes)
Lobjectif du projet de séquençage du génome de Bacillus subtilis était de tenter de comprendre le rôle, s'il existe, de la répartition des gènes dans le chromosome, en analysant leur organisation et la dynamique de leur expression. Une réflexion approfondie m'a conduit à identifier le métabolisme des polyamines et le métabolisme du soufre comme des sondes particulièrement sensibles des liens possibles entre architecture génomique, architecture cellulaire et expression génétique (1, 2). Le soufre est un élément privilégié en raison de sa réactivité, qui le rend sensible à toutes les pressions de sélection. En bref, trouver dans une même cellule à la fois H₂S et O₂, en présence de catalyseurs métalliques, est un peu de même nature que gratter une allumette dans une station d'essence. On doit penser que bien des étapes de ce métabolisme doivent être fortement compartimentées : la question qui se pose est alors de savoir si cette compartimentation va se refléter dans l'organisation des gènes correspondants.

Cependant, du fait de sa réactivité, le soufre a été un élément peu étudié. Mais la connaissance de tous les gènes d'un génome, en parallèle avec des techniques efficaces de modification des gènes in situ, permet de renouveler la question (on trouvera une réflexion détaillée sur le rôle du soufre dans 3, et aussi à ce site (en anglais)). Nous avons donc d'abord mis en place la problématique, déterminé les voies principales de l'anabolisme (4, 5), puis du catabolisme des molécules soufrées chez B. subtilis (6, 7, 8). Dans un deuxième temps, les premiers éléments de régulation ont été mis au jour (9, 10). L'analyse du protéome et du transcriptome a aussi permis d'étudier la régulation globale en réponse à la disponibilité en soufre dans le milieu et d'identifier de nouveaux gènes intervenant dans le métabolisme de cet atome (11, 5).

Un élément central de l'activité de l'Unité a été l'intégration systématique de la recherche in silico (analyse génomique) avec les prédictions expérimentales, et nous avons trouvé que les gènes du métabolisme du soufre sont regroupés en îlots et que les produits des gènes du métabolisme du soufre sont particulièrement pauvres en méthionine et cystéine, les deux acides aminés soufrés (12). Cette observation générale implique que la sélection sur le phénotype puisse avoir un impact sur l'organisation génomique. Bien entendu, il ne s'agit nullement d'un façon lamarckiste de voir les choses, comme un raisonnement superficiel pourrait le faire croire : ce sont les organismes où les gènes sont regroupés qui sont simplement le mieux adaptés, et qui, en compétition avec ceux qui n'ont pas ce trait, se multiplient le plus efficacement. La carence en acides aminés soufrés des gènes de biosynthèse correspondants s'explique aisément, quant à elle, par la contrainte qu'exerce le manque relatif de soufre en amont de son acquisition par le métabolisme. On remarque donc ainsi le rôle important de la sélection dans la formation des objets de la cellule au niveau moléculaire.

Au sein de l'Unité GGB, c'est le volet anabolique et régulateur du métabolisme du soufre qui a été étudié (Isabelle Martin-Verstraete) alors que le recyclage du soufre a été étudié au HKU-Pasteur Research Centre (Agnieszka Sekowska). Les chercheurs de l'Unité ont ainsi complètement décrypté le mécanisme de la biosynthèse de la cystéine et de la méthionine très peu connu jusque là chez B. subtilis. Ces travaux ont aussi identifié deux activateurs impliqués dans le contrôle de l'expression en réponse à la disponibilité de cet atome dans le milieu. La conclusion de ces travaux est que les Firmicutes se comportent très différemment des entérobactéries, non seulement dans la régulation des voies correspondantes (ce qui n'est pas inhabituel, car les régulations se conservent peu au cours de l'évolution), mais dans les réactions métaboliques elles-mêmes. Cela donne un intérêt particulier à leur étude, en fournissant des pistes intéressantes pour l'identification de cibles antibiotiques totalement nouvelles. La ressemblance des Firmicutes avec les Archébactéries est par ailleurs tout à fait notable (13). Il s'agit d'une observation importante dans le débat actuel qui entoure l'origine des organismes procaryotes.

En parallèle, toutes les étapes de la synthèse des polyamines ont été identifiées, et en particulier celles qui sont liées au métabolisme du soufre (6, 13, 14). Cela a conduit les chercheurs de l'Unité et du HKU-Pasteur Research Centre à caractériser complètement le cycle de recyclage de la méthionine (« methionine salvage pathway ») qui, à partir de la S-adénosylméthionine, régénère la méthionine par recyclage du S-méthylthioribose sans oxydation de l'atome de soufre (7). Cette voie est très originale, et l'une des enzymes impliquées, très voisine de la ribulose-bisphosphate-carboxylase oxygénase (RuBisCO), conduit à s'interroger à la fois sur le concept de recrutement d'activités enzymatiques dans les chemins métaboliques au cours de l'évolution (évolution acquisitive), et sur l'origine même de la RuBisCO. Une mise à jour complémentaire, démontrant la production probable de monoxyde de carbone par B. subtilis et illustrant cette nouvelle voie métabolique chez de nombreux organismes a été publiée début 2004, comme premier élément de collaboration au sein du consortium européen pour l'annotation génomique BioSapiens (15).

1.1.2. Organisation du chromosome et contrôle de l'expression génétique (Entérobactéries et bactéries à coloration de Gram négative)

Malgré de très nombreux travaux, par des laboratoires du monde entier, l'architecture chromosomique bactérienne est très mal connue, de même que son lien avec l'expression génétique et avec l'architecture cellulaire. Nous avons développé un certain nombre de réflexions et d'études in silico montrant que loin d'être aléatoire la répartition des gènes dans les chromosomes bactériens suit un certain nombre de règles (1, 2, 16, 17, 18, 19). Outre l'étude de B. subtilis, nous avons poursuivi en parallèle celle d'Escherichia coli, du fait de l'immense connaissance accumulée dans le monde à son sujet. Cependant, afin de replacer nos expériences dans un contexte biologique intégré, ce que nous obtenons avec E. coli est comparé aux résultats obtenus avec d'autres bactéries apparentées, et en particulier avec le modèle Photorhabdus luminescens, que nous avons choisi d'étudier parce qu'il vit en cultures pures en milieu sauvage, à la différence de E. coli, et interagit avec des hôtes très bien identifiés (un nématode et des larves d'insectes).

Plus spécialement, avec Philippe Bertin, nous avons choisi d'étudier la protéine H-NS, supposée jouer un rôle dans la structuration du chromosome. Il ne fait pas de doute que cette protéine interagit avec des acides nucléiques ARN ou ADN (ou les deux), mais son rôle dans l'architecture du chromosome, directe ou indirecte, est incompris. Nous avons donc entrepris une étude phylogénétique destinée à glâner des hypothèses sur sa fonction à partir d'organismes vivants dans des milieux très variés (à froid en particulier, puisqu'il s'agit d'une protéine du « choc froid ») (20, 21)), et nous avons recherché au moyen de techniques d'exploration à grande échelle, transcriptome et protéome, les cibles de son action au cours de chocs acides ou de croissance en milieu acide (22, 23, 24). Ces études ont confirmé le rôle très important de la protéine et ont montré une relation forte avec la gestion des protons par la cellule. Une cible préférentielle de son action paraît être l'ARN, dans des conditions qui restent à élucider. A côté de son rôle de régulateur négatif nous avons mis en évidence un rôle positif de la protéine, analysé aussi par génomique comparative (25, 26, 27). Ces travaux m'ont conduit à lancer à mon retour de Hong Kong au printemps 2003 un programme de génomique fonctionnelle d'une bactérie psychrophile, Pseudoalteromonas haloplanktis en collaboration avec le Génoscope et des laboratoires italiens, belges et suédois.

1.2. Résultats technologiques

1.2.1. Transcriptome
Lidentification de la séquence complète des génomes, associée à l'identification des gènes (nous avons participé à la mise au point de la plateforme de réannotation et d'identification des gènes bactériens, AMIGA (28), inventée par C. Médigue désormais au Génoscope) permet de rassembler sur un même support l'ensemble des sondes génétiques pour caractériser l'expression de tous les gènes d'une bactérie. Ces données d'annotation ont été utilisées en parallèle avec le développement de techniques de formation de l'ADNc à partir des messagers bactériens (techniques difficiles du fait de la brièveté de la durée de vie des ARN messagers, et du fait de l'absence de polyadénylation) pour développer de nouvelles techniques d'analyse statistique des résultats en collaboration avec le Laboratoire Génomes et Informatique de l'Université d'Evry et des chercheurs de l'Institut National Agronomique. Nos premiers travaux dans ce domaine utilisaient des approches relativement classiques (en particulier en statistique l'analyse de la variance (29, 11)). Plus récemment, nous avons utilisé à la fois une modification des protocoles d'extraction de l'ARN et de la fabrication de l'ADNc, et des techniques statistiques que nous avons développées au HKU-Pasteur Research Centre qui ne se limitent plus à la statistique gaussienne, mais à ses composantes indépendantes (Independent Component Analysis, 30).

1.2.2 . Protéome
Notre laboratoire a longtemps développé l'électrophorèse bidimensionnelle, et nous avons mis au point un protocole très reproductible de préparation des gels en immobilines, qui nous permettait une analyse fiable des images. Notre activité, depuis la création de l'URA 2171, a consisté à valider cette approche sur trois types bactériens : E. coli, B. subtilis et P. luminescens (10). Cette activité a été poursuivie (cf plus bas) avec de nouveaux modèles bactériens pour lesquels nous établissons des cartes protéomiques de référence.

1.2.3. Bases de données spécialisées
Plusieurs milliers de séquences de génomes complets sont désormais connues. Un génome conçu comme une simple collection de gènes est inutilisable pour des études approfondies. Il est nécessaire d'organiser la connaissance correspondante (présence et nature des gènes, promoteurs, terminateurs, etc) sous une forme directement accessible et permettant de faire des rapprochements (exploration des « voisinages » initialement développée dans la base de connaissances Indigo). Nous avons depuis une quinzaine d'années développé un modèle de données adapté à l'extraction des informations (séquences et annotations) selon des critères directement inspirés des souhaits des expérimentateurs. Ce modèle de données, GenoChore, a été initialement appliqué au génome de E. coli avec les annotations les plus récentes disponibles ( Colibri ) puis à celui de B. subtilis (SubtiList) et nous l'avons généralisé à un grand nombre de génomes bactériens (31).

En parallèle nous avons développé l'usage de notre plateforme d'annotation Imagene, pour réannoter les séquences génomiques et découvrir les erreurs possibles de séquençage (28). Cela nous a permis par exemple, en parallèle avec le séquençage d'isolats de patients, d'identifier de façon non ambiguë le gène secE chez Helicobacter pylori (32). Au HKU-Pasteur Research Centre, grâce au contrat BIOSUPPORT que nous avons obtenu du gouvernment de Hong Kong nous avons développé la construction d'une vingtaine de bases de données nouvelles (y compris pour un petit eucaryote, Encephalitozoon cuniculi, CunicuList) fondées sur un nouveau modèle de données adapté à l'usage de logiciels libres pour la gestion des données génomiques. Ce travail a cessé en 2010 à l'Université de Hong Kong, et il s'est poursuivi à Shenzhen au BGI jusqu'en 2016.

1.2.4. Analyse des séquences
Disposant de nombreux génomes annotés, il nous a été possible d'étudier leurs particularités globales. Nous avons découvert que, malgré une gestion très variable de la structure de l'ADN (analyse des répétitions (33, 34), il existait chez un grand nombre de bactéries un biais considérable entre la composition du brin précoce et du brin retardé, au point qu'il est souvent possible de prédire de quel brin provient un gène en connaissant seulement la composition en acides aminés de la protéine qu'il code (35, 36). Nous avons par ailleurs mis en évidence de nombreux biais de composition, dont les plus importants sont certainement causés par la disponibilité des métabolites cellulaires, montrant par une mesure indirecte le bien fondé de notre approche du métabolisme (37).

2. Retour de Hong Kong 2003-2007 : le plan de la cellule est dans le chromosome

Lensemble de nos études conduisait à découvrir que la métaphore de la Machine de Turing pour rendre compte du comportement de la cellule jouait le rôle d'un programme de recherche efficace. En effet, nous trouvions systématiquement des règles dans l'organisation du génome bactérien, ce qui pouvait conforter l'hypothèse, tout en permettant de nombreuses découvertes même si la conjecture initiale était un jour mise en défaut. Pour comprendre les contraintes sélectives à l'origine de cette organisation il nous fallait imaginer des approches expérimentales. Comme on l'a dit plus haut, deux thèmes m'ont paru particulièrement dignes d'intérêt. Le premier consiste à étudier le rôle du soufre dans la cellule et la façon dont son métabolisme pourrait agir sur l'organisation génomique via la compartimentation de cet élément très réactif (son état d'oxydation varie de -2 à +6). Pour cela il nous fallait étudier la façon dont sont construites, transportées et recyclées les molécules comprenant un atome de soufre. Le deuxième est centré sur l'importance de l'entropie dans la structuration des macromolécules biologiques. Et comme c'est l'eau qui est le principal vecteur du contrôle du rôle de l'entropie, et il était particulièrement intéressant d'étudier ce qui se passe à basse température, au moment où la structure de l'eau va commencer à s'organiser pour produire de la glace (en dessous de 10-12°C) et d'étudier le comportement général des molécules d'ARN particulièrement sensibles à la structure de l'eau.

2.1. Métabolisme du soufre

2.1.1. Anabolisme
Quatre grandes catégories de molécules contenant du soufre doivent être synthétisées dans la cellule (ou acquises de l'environnement) : deux acides aminés, plusieurs coenzymes, les noyaux fer-soufre, et un certain nombre de groupements responsables de modifications de macromolécules essentielles (ARN de transfert) (3). Nous avons commencé par décrypter les étapes essentielles de la synthèse de la cystéine et de la méthionine, très partiellement connues jusque là, chez B. subtilis (4, 5). De plus, une partie significative de la voie de transsulfuration inverse (synthèse de cystéine à partir de méthionine) a été déchiffrée. Mais la totalité de la voie, visiblement très originale, n'est pas encore complètement élucidée (38, 39). Nous avons désormais identifié les régulateurs essentiels de ce métabolisme, et en particulier le gène maître cymR (40). Nos travaux indiquent que CymR agit en concertation avec une enzyme de la voie de biosynthèse de la cystéine, comme c'est parfois le cas d'autres voies anaboliques essentielles.

2.1.2. Recyclage
Coûteuse en énergie, la méthionine est recyclée, d'une part au début des protéines et d'autre part en aval de l'utilisation de la S-adénosylméthionine. Nous avons fait une analyse génétique et biochimique des gènes map et yflG (rebaptisé mapB, car nous avons montré qu'il code effectivement une méthionine aminopeptidase (41)) et établi dans le détail le cycle de récupération du méthylthioribose (étude par mutagenèse dirigée de l'énolase MtnW analogue à la RuBisCO en collaboration avec le laboratoire dirigé par Akiho Yokota, au Nara Institute of Science and Technology, à Nara, Japon (42)). Nous avons identifié le mécanisme du recyclage de la méthionine non seulement chez B. subtilis, mais aussi chez Pseudomonas aeruginosa (in vivo) et chez plusieurs autres organismes (in silico) (15). Par ailleurs, nous avons commencé à identifier les « fuites » des divers cycles métaboliques impliquant le soufre avec l'idée que les produits en question doivent être eux-mêmes métabolisés, probablement par le biais de gènes à la fonction inconnue. Cela nous a conduits à identifier un lien insoupçonné entre le processus général de la dégradation des ARN et le métabolisme du soufre. La suite de cette étude a permis d'explorer le métabolisme de plusieurs souches pathogènes de E. coli (programme ColiScope), de la bactérie d'une espèce différente la plus proche, Escherichia fergusonii, et de Pseudomonas putida (programme Européen Probactys).

2.1.3. Transport
Un aspect marquant du passage du commensalisme à la pathogénicité ou à la symbiose est la façon dont se fait l'interaction entre le pathogène et l'hôte via la construction du métabolisme intermédiaire et du transport des métabolites correspondants. Au cours de la symbiose, par exemple, des échanges mutuels de métabolites expliquent le caractère indispensable de l'interaction entre l'hôte et son symbiote. De même, le transport de molécules du métabolisme intermédiaire joue un rôle essentiel dans la persistance de l'infection et dans la résistance aux antimicrobiens. Comme les symbiotes, les pathogènes sont souvent inféodés à leur hôte via un cycle d'échanges métaboliques. Il est encore difficile d'identifier ces échanges, très spécifiques, en raison d'une méconnaissance générale des systèmes de transport chez les bactéries, où quelques modèles seulement ont été étudiés jusqu'à présent. Nos expériences ont montré que comme beaucoup d'autres bactéries ayant un génome de taille comparable, B. subtilis possède un très grand nombre de systèmes de transport au moins partiellement redondants. Il s'agit là vraisemblablement d'une source originale de variabilité qui peut avoir été explorée par divers pathogènes apparentés. Malgré la difficulté de l'approche (il est difficile de mettre en évidence les fonctions quand elles se compensent partiellement) nous avons, en utilisant des analogues toxiques et la banque des mutants du consortium Europe / Japon, identifié les principaux systèmes de transport de la cystéine et de la méthionine (43, 44). Il reste à comprendre le transport du sulfate, et bien sûr la gestion des excès de concentration intracellulaire de molécules soufrées. J'ai dans ce contexte analysé formellement le rôle des cycles futiles dans le transport des métabolites, et montré comment certaines étapes comme la modification par transacétylation servait de soupape de sécurité dans le cas où un métabolite est transporté par une perméase très efficace. C'est l'explication générale de la présence de l'acétyltransférase LacA au sein des produits de l'opéron lactose (45).

Ce travail d'exploration des voies métaboliques et du transport, curieusement pionnier dans son domaine (le métabolisme n'est plus à la mode), demandera quelque temps avant d'être pleinement intégré à la connaissance détaillée des organismes vivants. Comme dans le cas de notre travail pour la construction de bases de données spécialisées, l'essentiel de l'activité de l'Unité est pour ce thème particulier destiné à servir de référence à l'avenir (c'est à dire que nous espérons que les travaux en question seront encore cités dans vingt ans, même s'ils sont devenus entre temps des lieux communs....). Nous développerons autant que possible l'étude du métabolisme dans son rôle de structuration des génomes, et en particulier celle des métabolites "orphelins", dont personne, bizarrement, ne se soucie. Et pourtant, comme le disait Lavoisier créant la Chimie moderne : "rien ne se perd, rien ne se crée, tout se transforme".

2.2. Un lien insoupçonné entre le métabolisme du soufre et le métabolisme de l'ARN

Au cours de l'étude du métabolisme du soufre des travaux anciens ont montré que la structure de l'ARN messager jouait un rôle important, via un contrôle par atténuation de la transcription opérant au travers de la formation de "riboswitches". Dans cette veine d'intérêt pour l'ARN, (voir plus bas) nous avons mis en évidence de nombreux petits ARN non traduits (ncRNA) au cours de l'analyse de la régulation de l'expression de gènes essentiels pour l'occupation de l'environnement chez Photorhabdus luminescens et Pseudoalteromonas haloplanktis. Mais c'est l'étude d'un métabolite produit en aval au cours de l'assimilation du soufre, le 3',5'adénosine bisphosphate (pAp), qui de façon inattendue est venue conforter notre intérêt pour l'étude du métabolisme de l'ARN.

En raison de sa ressemblance avec l'AMP cyclique, nous avons recherché si cette molécule pouvait avoir un rôle régulateur dans la cellule. Nous avons alors découvert, par une approche biochimique simple, que plusieurs protéines la reconnaissent spécifiquement. D'abord, comme on pouvait s'y attendre, c'est le cas chez E. coli de la 3'-phosphatase CysQ qui produit le 5'AMP et recycle la molécule. A la suite de ces travaux, de façon amusante nous avons inversé la sentence : "tout ce qui est vrai pour le colibacille est vrai pour l'éléphant", en découvrant qu'à l'instar de l'enzyme humaine, CysQ est très sensible au lithium ! Mais l'observation la plus remarquable a été que le pAp inhibe l'enzyme essentielle qui dégrade les ARN très courts (que nous avons nommés nanoARN, pour les distinguer des microARN), que ce soit chez E. coli (Orn) ou chez l'Homme (Sfn) (46). D'une façon générale, la dégradation des ARN combine des activités endonucléases avec des activités exonucléases processives. Or ces dernières enzymes sont incapables de dégrader un "reste" d'ARN très courts (de deux à cinq nuclétoides) qui peuvent donc interférer avec la machinerie de transcription. C'est ce qui explique leur importance essentielle. Pourtant, une analyse phylogénétique approfondie nous a montré que beaucoup de génomes, et ceux des Firmicutes en particulier, n'avaient pas l'homologue de la protéine Orn. Nous avons donc repris notre étude biochimique des protéines interagissant avec le pAp chez B. subtilis, et nous avons alors découvert une protéine à la fonction jusque là inconnue, YtqI (NrnA), dont la fonction est non seulement d'être une nanoRNase, mais aussi d'être une pAp phosphatase (47) ! Cette découverte inattendue montre qu'il existe un lien fort entre le métabolisme du soufre et le métabolisme des ARN, dans un schéma concerté qui a recruté des objets différents au cours de l'histoire évolutive, tout en maintenant la même intégration fonctionnelle. Nous étudions à présent la signification profonde de cette relation fonctionnelle.

2.3. Effet de la température sur l'organisation génomique et le passage entre le commensalisme et la pathogénicité : génomique de Photorhabdus luminescens, Pseudoalteromonas haloplanktis, Psychromonas ingrahamii, Herminiimonas arsenicoxydans et Staphylococcus epidermidis

Cette étude pointe à nouveau vers l'importance des ARN en tant que tels, et il est nécessaire d'en étudier les propriétés pour avoir un accès à la structuration des génomes qui ne soit pas strictement réduit à l'étude des gènes codant les protéines, ou à la composition particulière de l'ADN lui-même. Un moyen complémentaire de l'étude du lien entre architecture cellulaire et génome nous est offert par la comparaison entre bactéries de la même famille. En particulier on doit attendre que la température ait un effet majeur dans les fonctions de maintenance générale de la cellule et dans son organisation. La plupart des études a porté sur le rôle de la haute température, mais nous pensons qu'en raison du rôle de premier plan joué par la liaison hydrogène, la basse température sera plus intéressante encore. Il est donc nécessaire d'étudier, en complément de la génomique du l'organisme le mieux connu, E. coli, d'autres organismes didermes vivant dans des environnements aussi variés mais aussi bien définis que possible. Par ailleurs, si B. subtilis est un excellent modèle des Firmicutes, il a été surtout étudié en raison de sa capacité de sporuler, et il est donc très important d'étudier d'autres organismes de la même famille. Nous avons donc collaboré avec l'Université Fudan de Shanghai pour le séquençage et l'annotation d'une souche de Staphylococcus epidermidis de l'environnement (47), et développé toute une série d'analyses du comportement de cet organisme pour explorer le passage du commensalisme à la pathogénicité.

Nous avons d'abord entrepris l'étude d'une entérobactérie conduisant à des cultures pures dans la nature, P. luminescens. Le séquençage de son génome a été terminé fin 2002 (laboratoire Kunst / Glaser), et nous avons validé in vivo certaines prédictions essentielles obtenues par la séquence. Pour cela nous avons développé au laboratoire l'étude expérimentale de la croissance du modèle P. luminescens dans la larve du ver à soie (Bombyx mori) pour en faire un modèle d'analyse du transcriptome et du protéome. Nous avons en parallèle construit des matrices d'ADN comportant la quasi-totalité des gènes de l'organisme pour étudier ensuite l'expression génétique dans des conditions choisies (métabolisme du soufre, pour en comparer l'organisation à celle des Firmicutes). Une carte protéomique de référence a été constituée (48). L'ensemble de nos études de cet organisme au moyen de profils d'expression des ARN et des protéines nous a conduit à caractériser un certain nombre de systèmes régulateurs qui influencent le développement de la bactérie dans son hôte insecte (49, 50). Les observations correspondantes permettent de comprendre en partie la virulence d'autres entérobactéries, et de relier l'expression génétique globale (celle du cœur du génome) à celle des gènes qui sont spécifiques d'une niche écologique particulière. En bref, il apparaît de plus en plus que de petits ARN non traduits jouent un rôle essentiel dans la modulation des propriétés phénotypiques de la bactérie (nous avons identifié l'homologue de CsrB d'E. coli, et montré comment il intervient dans le contrôle de l'utilisation de la biomasse de l'insecte par la bactérie).

De l'étude de la bactérie Antarctique Pseudoalteromonas haloplanktis TAC125 nous avons extrait des informations intéressantes sur la structuration des génomes en termes d'occupation d'une niche particulière. Le génome de cette bactérie est fait de deux chromosomes et d'un plasmide, et nous avons caractérisé chez celle-ci le premier chromosome vrai (il code plusieurs protéines essentielles, dont l'ensemble de la synthèse de l'histidine, y compris l'histidine ARNt synthétase) dont la réplication soit unidirectionnelle comme celle des plasmides et non bi-directionnelle comme c'est généralement le cas (51). Cette bactérie, capable de se multiplier extraordinairement vite à 0°C, possède un métabolisme très différent de celui d'E. coli. En particulier, elle ne métabolise pas le glucose et ne possède pas les systèmes connus liés à la répression catabolique. Nous avons reconstruit les multiples astuces métaboliques qui lui permettent de proliférer dans cet environnement hostile pour l'homme. A partir de la séquence du génome que nous avons déterminée, nous avons ainsi trouvé comment la bactérie a su s'adapter à la présence de la haute concentration de l'oxygène atmosphérique qui se dissout très bien dans l'eau froide et devient alors un élément réactif très toxique générant des radicaux libres. Au lieu de développer des voies métaboliques qui servent à éliminer les produits toxiques issus de ce gaz, comme le font les autres organismes, P. haloplanktis a au contraire optimisé les mécanismes lui permettant de l'utiliser directement comme source d'énergie ou de catabolisme de substrats variés. Elle a aussi entièrement éliminé une famille de voies métaboliques produisant des dérivés toxiques de l'oxygène, les voies utilisant le coenzyme molybdoptérine. Par ailleurs, pour garder une bonne fluidité de sa membrane, ce qui l'empêche de se figer aux basses températures, la bactérie modifie sa composition lipidique grâce à une enzyme particulière qui, elle aussi, utilise ce même oxygène présent et participe donc à la fois à son élimination et à l'adaptation au froid (évolution "concertée") (51).

De nombreuses propriétés ont encore été mises au jour, comme la modification de la composition en acides aminés des protéines de cette bactérie. En effet, les organismes vivant aux températures dites normales utilisent relativement peu un acide aminé fragile, l'asparagine, malgré ses propriétés intéressantes, car il dégénère chimiquement au cours du temps par cyclisation et déamidation et est donc un des facteurs les plus importants du vieillissement. La bactérie P. haloplanktis, protégée du vieillissement par le froid, utilise l'asparagine en plus grande proportion dans ses protéines que ne le font les organismes mésothermes ou thermophiles. L'analyse approfondie de toutes ces voies nouvelles pourrait ouvrir la voie vers la découverte d'outils permettant par exemple de synthétiser à basse température des molécules intéressantes ou utiles, comme l'albumine, qui sont actuellement difficiles à produire dans les conditions standard. Une première carte de son protéome a été établie (52). Le rôle de l'ARN non traduit CsrB a aussi été étudié, en parallèle avec sa fonction chez P. luminescens.

Afin d'analyser autrement le métabolisme du soufre, dans un contexte extrême, nous avons entrepris en collaboration avec P. Bertin (Université Louis Pasteur à Strasbourg, GDR2909), l'étude génomique de bactéries résistantes à l'arsenic. Le génome d'Herminiimonas arsenicoxydans (53), en parallèle avec l'étude de son protéome (54) nous donne déjà des pistes intéressantes pour comprendre le lien soufre-arsenic essentiel à la détoxication.

Enfin une étude comparative de plusieurs souches de S. epidermidis nous a permis, en comparant l'évolution du polymorphisme nucléotidique qui conserve ou modifie la séquence des protéines, d'identifier des gènes significativement soumis à un sélection purificatrice, et au contraire ceux qui sont soumis à une pression sélective neutre ou positive au passage du commensalisme à la pathogénicité. Nous avons ainsi prédit que certaines fonctions impliquées dans la résistance au stress oxydant sont fortement sollicitées au cours de cette évolution, et nous avons expérimentalement validé ces prédictions (55). A la suite de cette étude nous avons recherché un certain nombre de cibles possibles pour la création de nouveaux antibiotiques, et montré le potentiel de nouvelles molécules actives contre le régulateur YycG et contre la tryptophanyl-ARNt synthétase (56, 57).

2.4. Le paléome et le cénome : comment s'organisent les génomes bactériens

Depuis notre implication dans le séquençage des génomes, au milieu des années 80, nous avons compris la nécessité d'associer de façon intime l'approche classique in vivo et in vitro, avec l'approche que j'avais appelée alors « in silico » (le mot a fait fortune depuis), qui met en jeu de façon primordiale l'usage des techniques de calcul et des ordinateurs d'une façon heuristique, donc semblable à celle de l'expérience à la paillasse. Deux approches complémentaires sont nécessaires. D'une part l'organisation et la gestion des données. D'autre part, à partir de cette organisation, leur analyse.

2.4.1. GenoChore, un ensemble de bases de données génomiques spécialisées :
La première de ces approches, bien qu'elle soit partout d'une importance cruciale — une mauvaise information s'apparente à de la désinformation, est d'autant plus mal considérée (et financée) qu'elle est invisible. Les chercheurs qui s'impliquent dans ce domaine cherchent à contribuer au savoir général et non à leur faire-valoir, attitude bien peu récompensée... Pourtant il est absolument nécessaire de disposer d'une information fiable et accessible pour pouvoir développer en profondeur une analysée élaborée de la signification du texte génomique. Nous avons dû, en l'absence d'efforts concertés, veiller à développer nous-mêmes l'organisation et la gestion des données de séquence, en particulier du fait que ce qui est disponible à l'INSDC (dont je suis membre du Conseil International), sous la forme de Genomes Reviews ou de RefSeq ne peut qu'être toujours fortement décalé par rapport à la connaissance qui s'accumule rapidement au cours du temps. Nous avons donc développé cette activité selon le modèle de données que nous appelons désormais GenoChore, et qui sert de référence pour la construction de bases de données spécialisées bactériennes, très utilisées dans le monde. Notre projet actuel, en collaboration avec le groupe d'I. Moszer au sein du département, celui de C. Médigue au Génoscope, le HKU Computer Centre, et le Bioinformatics Centre à l'Université de Pékin est de développer un modèle « multi-souches », d'une part, et un modèle adapté à la gestion des données eucaryotes, d'autre part. Un premier modèle eucaryote a été réalisé à partir des données du génome de la Microsporidie Encephalitozoon cuniculi (CunicuList (31)). Plusieurs bases de données ont été ajoutées au premier ensemble créé durant mon séjour à Hong Kong : Clostridium acetobutylicum (AcetoList), P. haloplanktis (PsychroList), H. arsenicoxydans (ArseniList) ainsi qu'une version mise à jour de Colibri, pour Escherichia coli MG1655 avec les annotations les plus récentes (sans équivalent dans le monde actuellement). Nous avons par ailleurs systématiquement introduit une nomenclature révisée, permettant de retrouver immédiatement les gènes du cœur du génome (le paléome, cf plus bas) sans avoir besoin de connaître le code d'accès qui étiquette de façon différente les gènes de chacun des programmes génomes. Par exemple rechercher rpsL, le gène qui code la protéine S12 du ribosome, sera immédiatement possible, sans avoir besoin de savoir que ce gène se nomme LA3417 chez Leptospira interrogans Lai ou LIC10755 chez L. interrogans Fiocruz... Pour l'instant cet ensemble est maintenu grâce au bon vouloir du Computer Centre de l'Université de Hong Kong, mais il conviendra de trouver le moyen de pérenniser cet accord, ou de déplacer ces bases de données en un autre lieu, si l'on souhaite en conserver le contrôle et l'accès.

2.4.2. L'organisation du génome bactérien :
Si cette activité de fantassin est bien nécessaire pour la communauté internationale, son rôle était aussi de nous permettre d'exploiter nous-mêmes au mieux la connaissance qui s'accumule rapidement autour des génomes bactériens. Nous avons donc développé notre recherche afin de mettre au jour, si elles existent, les contraintes qui président à l'organisation de la répartition des gènes dans les génomes.

Dans une première étude, commencée à Hong Kong, nous avons analysé la présence de mots "flous" dans les génomes, et découvert qu'un ensemble universel de mots discontinus formés par des bases situées d'un même côté de la double hélice explique la période 10-11.5 universellement présente dans les génomes (thèse d'Etienne Larsabal, 58). Ces mots sont si densément répartis dans les génomes qu'ils contraignent parfois jusqu'à une base sur quatre dans la séquence, ce qui suppose l'existence de contraintes dans la suite des acides aminés des protéines. Par ailleurs leur présence indique qu'il sera sans doute nécessaire d'en prendre en compte l'existence lors des tentatives de construction de cellules, au cœur de la Biologie Synthétique.

Nous avions en 1991 été les premiers à mettre en évidence l'importance du transfert génétique horizontal chez les bactéries (et ce qui est aujourd'hui considéré comme un lieu commun de la génomique n'était pas du tout accepté à l'époque), au moyen d'une analyse détaillée du biais d'usage des codons chez le colibacille. Une étude similaire, au moment où nous avons terminé le premier séquençage du génome de B. subtilis nous avait donné une image du même type : il existe une classe de gènes dont le biais d'usage des codons diffère fondamentalement du biais général. Cette observation nous avait montré toute l'importance de l'étude des voisinages pour une approche inductive de la prédiction des fonctions biologiques, et dans un travail publié en 1998 nous avions montré tout le parti qui pouvait être tiré de l'analyse des voisinages, au sens large, d'un objet biologique quelconque. En particulier nous avions découvert que les gènes ayant un biais d'usage des codons voisin étaient fonctionnellement reliés. Il nous restait à comprendre comment cela s'organisait dans le chromosome. Une discussion avec Massimo Vergassola nous a permis d'envisager de reprendre cette étude au moyen d'une approche nouvelle fondée sur une lecture originale des théories de l'information. Nous avons alors pu montrer que dans le chromosome bactérien, les gènes s'organisent en petits ensembles (quatre ou cinq classes en général) de gènes partageant le même biais d'usage des codons. Et, fait remarquable, ces ensembles sont sensiblement plus longs que la longueur moyenne des opérons (au moins trois fois plus longs). En bref, la traduction, via l'utilisation d'ARN de transferts rares, organise la structure des génomes bactériens (thèse de Marc Bailly-Béchet, 59).

Ainsi trois contraintes générales organisent la structure des génomes bactériens :
– chez les bactéries à reproduction rapide, les gènes permettant la multiplication sont proches de l'origine de réplication (effet de dosage génique)
– les gènes essentiels sont transcrits dans le brin direct, pour éviter les conflits transcription/réplication
– des îlots ayant un biais spécifique dans l'usage des codons constituent le chromosome, avec au moins les fonctions suivantes: machinerie centrale de l'expression génétique, métabolisme intermédiaire, motilité et transferts génétiques horizontaux.
A ce stade, il devient clairement essentiel de comprendre la nature des gènes formant ces différentes classes pour en étudier l'organisation dans le génome. D'abord une observation importante : si l'on cherche simplement les gènes qui se trouvent dans tous les génomes pour en déduire la cellule minimale, on tombe sur un phénomène remarquable. Au fur et à mesure que de nouveaux génomes sont déchiffrés ce nombre ne cesse de décroître, au point qu'on peut penser qu'un jour aucun gène ne sera plus commun à tous les génomes. Ce fait, surprenant pour un observateur superficiel, vient de ce que la vie ne constitue pas un ensemble d'objets, mais correspond à un processus physique beaucoup plus abstrait, formé de relations entre objets (et même de relations entre relations). Il s'en suit que plusieurs objets d'origine différente peuvent avoir la même place, la même fonction, dans l'ensemble relationnel qui constitue la vie. Au cours de l'évolution il arrive donc constamment qu'un nouveau gène, arrivé par transfert horizontal, puisse coder une fonction de façon plus efficace, ou mieux adaptée qu'un gène existant. Après quelques générations ce nouveau gène pourra avoir remplacé l'ancien. C'est ce processus de capture de structures pour réaliser des fonctions qui est caractéristique de l'aspect « bricolé » des organismes vivants (42). Notons que ce fait est d'une importance capitale pour la Biologie Synthétique, car il signifie que le bricolage à l'œuvre (l'évolution par remplacement d'un objet par un autre est purement accidentelle, même si la sélection oriente sans cesse vers une meilleure adaptation à des conditions données) pourra être remplacé par un vrai dessein intelligent, celui décidé par l'homme ! Les fonctions à comprendre sont donc celles d'un ensemble de gènes « persistants », présents dans une majorité de génomes, et non d'hypothétiques gènes ubiquistes. Nous avons donc construit une approche systématique nous permettant d'identifier les gènes persistants, et découvert qu'ils forment un ensemble de 400-500 gènes dont les fonctions ne sont pas du tout quelconques (60).

Dans un travail ultérieur nous avons montré que ces gènes, qui dirigent à la fois la synthèse des composés essentiels à la vie et leur maintenance, restent, dans un ensemble de génomes qui s'étendent à travers tout l'arbre évolutif des Bactéries, regroupés selon une organisation très proche de ce qu'on peut considérer comme un scénario plausible de l'origine de la vie (61).

Pour cette raison, nous avons nommé cet ensemble de gènes persistants le paléome. Une analyse approfondie de la façon dont les gènes se regroupent dans les différents génomes nous a ensuite montré que deux ensembles bien distincts sont constitués de gènes qui tendent à rester regroupés. Outre les gènes du paléome, les gènes les plus rares, on oberve en effet que ceux qui ne se trouvent que dans un petit nombre de génomes sont eux-aussi regroupés. Ce dernier cas de regroupement est bien connu. Il est beaucoup moins surprenant que le premier puisque ces gènes rares sont typiquement ceux du transfert horizontal, qui s'opère grâce à la conjugaison, à la lysogénie ou à la transduction. Une analyse fine de leur fonction (lorsqu'elle est connue), montre que ces gènes, typiquement, sont impliqués dans l'occupation d'une niche particulière. Nous les avons donc nommé, gènes du cénome (comme "biocénose") pour indiquer ce fait qu'ils participent à la définition d'une communauté de fonctions, celle qui correspond à une niche. En bref, un génome bactérien est organisé en un paléome dirigeant la construction de la cellule et sa maintenance, associé à un cénome qui lui permet de se développer dans un environnement particulier (62). Les contraintes qui existent sur la taille du génome vont limiter à une sous-catégorie, pour chaque souche d'une espèce donnée, le choix des gènes du cénome, ce qui fait que, pour une espèce donnée (le colibacille par exemple), alors que le paléome reste constant, les gènes du cénome ont un nombre qui s'accroît constamment au fur et à mesure qu'on découvre de nouvelles souches. Cette organisation est celle qui devra être prise en compte pour permettre la construction d'une cellule artificielle, projet central de la Biologie Synthétique.

Nous explorons désormais les raisons qui ont conduit au regroupement des gènes au cours de l'évolution, en prenant la précaution de n'invoquer aucune contrainte "instructive" qui aurait été à l'origine de ce regroupement (il n'y a évidemment pas de "dessein intelligent" !)

2.5. Un lien avec les implications sociales de la modélisation : SRAS, grippe aviaire et maladie de la vache folle

De ma formation de mathématicien, j'ai conservé l'intérêt pour la formalisation de problèmes généraux. L'épidémie de SRAS qui a touché Hong Kong au moment où j'ai quitté cette ville m'a conduit à imaginer des scénarios épidémiques que nous avons commencé à formaliser avec des mathématiciens du Département de Mathématiques de l'Université de Hong Kong. A mon retour j'ai poursuivi cette activité avec Gabriel Turinici (Université de Paris 9 Dauphine et INRIA). Cette étude met en évidence un rôle possible de l'évolution parallèle de plusieurs virus, et pourrait être intéressante pour comprendre la façon dont évolue la grippe aviaire (63). Dans un domaine différent, nous nous sommes intéressés à la diffusion des maladies à prions. En effet, ces maladies existent dans l'environnement chez de nombreux animaux sauvages, dans des conditions où il est absolument impossible d'invoquer la contamination par de la farine animale mal traitée, comme on le fait généralement pour l'épidémie qui a sévi en Grande-Bretagne. De plus, dans le cas de la tremblante du mouton, plusieurs cas de "pâtures contaminées" ont été observés. Là encore il est difficile d'invoquer une source de nourriture artificielle. Ne pourrait-on pas, dans ce cas, imaginer la contagion par un vecteur ? Nous avons construit un modèle où le vecteur serait un microorganisme susceptible de provoquer chez l'hôte une réponse immune, et par conséquent de provoquer une immunité à la contagion (pas au prion, bien sûr). Ce scénario permet parfaitement de reproduire l'épidémie chez les bovins en Grande-Bretagne (64). Quel serait ce vecteur ? Une famille de parasites qui infectent les animaux, depuis les insectes jusqu'à l'Homme, celle des Microsporidies, répond très bien à la question. Il s'agit en effet d'organismes qui se propagent par ingestion, et forment des spores. Ils passent du tube digestif au système nerveux central, où ils se reproduisent par multiplication intracellulaire. Ne peut-on imaginer qu'une petite proportion puisse incorporer des prions dans la spore, et ainsi les propager ? Il nous semble que l'hypothèse mérite d'être explorée. En particulier il serait du plus haut intérêt d'avoir une idée du niveau habituel de contamination des vertébrés, y compris de l'Homme, par ces parasites. Nous avions amorcé une étude en ce sens à Hong Kong...

GÉNÉTIQUE ET GÉNOMES