Accueil / Chroniques / La métagénomique : comment étudier la biodiversité microscopique
π Santé et biotech π Science et technologies

La métagénomique : comment étudier la biodiversité microscopique

Tania Louis
Tania Louis
docteure en biologie et chroniqueuse chez Polytechnique Insights 
En bref
  • La métagénomique est une technique combinant biologie moléculaire et informatique qui permet d’étudier l’ensemble du monde microbien.
  • On peut ainsi analyser les génomes au niveau d’un échantillon entier afin de caractériser des écosystèmes complets.
  • Une étude métagénomique se réalise en deux grandes étapes : la récupération d’échantillons et le séquençage.
  • Séquencer les génomes nécessite une grande maîtrise en bioinformatique, ce qui rend le développement de la métagénomique indissociable du développement du Big Data.
  • Si la métagénomique est coûteuse et lourde à mettre en place, elle reste néanmoins prometteuse et nous permet de découvrir une biodiversité microscopique encore inconnue.

Leur petite taille rend cette réal­ité dif­fi­cile à percevoir mais les micro-organ­ismes sont, de loin, les entités les plus nom­breuses sur notre planète. Bac­téries, archées, virus, champignons et autres eucary­otes minus­cules sont présents à peu près partout et for­ment des écosys­tèmes qui échap­pent à la fois à nos yeux et à nos éprou­vettes, puisqu’on estime que seule­ment 1 à 2 % des micro-organ­ismes sont facile­ment cul­tivables en lab­o­ra­toire. Pour­tant, il est désor­mais pos­si­ble d’étudier l’ensemble du monde micro­bi­en grâce à une tech­nique com­bi­nant biolo­gie molécu­laire et infor­ma­tique : la métagénomique.

Décortiquer les génomes

Comme l’indique ce terme inven­té en 19981, l’idée générale est d’analyser les génomes non plus à l’échelle d’un indi­vidu ou d’une espèce mais au-delà, au niveau d’un échan­til­lon entier. Cela per­met d’accéder à l’ensemble des micro-organ­ismes qu’il con­tient, dont ceux qu’on ne sait pas cul­tiv­er, et de car­ac­téris­er des écosys­tèmes com­plets. Mais, si des pro­grès tech­nologiques récents font de la métagénomique une approche en plein essor, sa mise en œuvre reste complexe.

Prenons un peu de recul pour remet­tre les choses en per­spec­tive. Le pre­mier génome à avoir été séquencé, en 1977, est celui d’un virus bac­tério­phage qui mesurait env­i­ron 5 300 nucléotides2. Ont suivi les bac­téries3 et les lev­ures4 puis, finale­ment, le génome humain : pub­lié au début des années 2 000, des cen­taines de mil­lions d’euros et des années de tra­vail ont été néces­saires pour décrypter la majeure par­tie de ses 3 mil­liards de nucléotides5. La pre­mière séquence vrai­ment com­plète d’un génome humain n’a quant à elle été pub­liée qu’en avril 20226 !

Ain­si, le séquençage est une tech­nique rel­a­tive­ment récente, qui ne cesse de s’améliorer… Si bien qu’il est aujourd’hui pos­si­ble de séquencer un génome humain avec une qual­ité sat­is­faisante pour « seule­ment » 1 000 €, en une seule journée. Il existe en fait dif­férentes tech­niques de séquençage dit « de nou­velle généra­tion », dont la pré­ci­sion, la vitesse et le coût vari­ent, et il est désor­mais pos­si­ble de récupér­er en par­al­lèle des mil­lions voire des mil­liards de séquences pour analyser des dizaines de mil­liards de nucléotides chaque jour. C’est le pre­mier pro­grès tech­nologique qui per­met l’étude simul­tanée des génomes de com­mu­nautés de micro-organ­ismes… Mais ce n’est pas le seul.

En effet, séquencer beau­coup de nucléotides con­duit à récupér­er beau­coup de don­nées numériques, qu’il faut ensuite être capa­ble de manip­uler. Le développe­ment de la métagénomique se fait donc en par­al­lèle de celui du Big Data. Stock­age, capac­ités de cal­cul, développe­ment d’outils ou ges­tion de bases de don­nées : faire par­ler les génomes néces­site des équipements et des com­pé­tences solides en bioinformatique.

Exem­ple d’une cel­lule d’écoulement util­isée pour du séquençage mas­sive­ment par­al­lèle : des mil­liers de morceaux d’ADN sont fixés sur la cel­lule et séquencés simul­tané­ment. Pho­to par Eplisterra.

La métagénomique se situe ain­si au car­refour de deux domaines en pleine évo­lu­tion, et ses pos­si­bil­ités ne cessent de s’améliorer. Il peut être ten­tant d’y voir un nou­veau Graal de la micro­bi­olo­gie, per­me­t­tant de décou­vrir un monde micro­scopique qui, jusqu’ici, nous échap­pait. Néan­moins cette approche reste lourde, coû­teuse et semée d’embûches. Avant de la mobilis­er, mieux vaut avoir bien affûté la ques­tion à laque­lle on essaye de répon­dre et peaufin­er son pro­to­cole pour éviter d’être enseveli sous un mon­ceau de don­nées inexploitables.

La métagénomique pas à pas

La pre­mière étape d’une étude métagénomique est la récupéra­tion d’échantillons. Qu’on s’intéresse aux micro-organ­ismes d’un sol, d’un point d’eau ou du micro­biote humain, il faut tra­vailler sur des échan­til­lons adap­tés à la ques­tion qu’on se pose, com­pa­ra­bles entre eux (la com­po­si­tion du sol ne sera par exem­ple pas la même à des endroits dif­férents, à des pro­fondeurs dif­férentes ou pen­dant des saisons dif­férentes), suff­isam­ment nom­breux et divers pour être représen­tat­ifs, et assez volu­mineux pour pou­voir y récupér­er les quan­tités d’ADN néces­saires à la suite du protocole.

Dif­férents procédés peu­vent être util­isés pour cette extrac­tion, dont le pro­to­cole est opti­misé selon le milieu d’origine, les types d’organismes d’intérêt et le matéri­au qu’on veut récupér­er. En effet, la pré­pa­ra­tion de l’échantillon est l’occasion de tri­er les organ­ismes étudiés (par exem­ple en fil­trant pour ne garder que ceux faisant une cer­taine taille) et de sélec­tion­ner le type d’acides nucléiques qui seront séquencés ensuite. Il est notam­ment pos­si­ble de puri­fi­er les ARN mes­sagers plutôt que l’ADN génomique pour analyser l’activité réelle d’une com­mu­nauté micro­bi­enne : on par­le alors de méta­tran­scrip­tomique plutôt que de métagénomique.

La pré­pa­ra­tion de l’échantillon est l’occasion de tri­er les organ­ismes étudiés et de sélec­tion­ner les acides nucléiques à séquencer.

Arrive ensuite l’étape du séquençage, avec deux approches pos­si­bles : la métagénomique ciblée ou la métagénomique glob­ale. La métagénomique ciblée est prin­ci­pale­ment util­isée pour iden­ti­fi­er et class­er les espèces présentes dans un échan­til­lon. Dans ce cas, seules cer­taines par­ties des génomes, con­sid­érées comme spé­ci­fiques d’un type d’organismes ou d’une gamme de fonc­tions, sont ampli­fiées, séquencées et analysées. La métagénomique glob­ale per­met quant à elle de car­ac­téris­er fine­ment des com­mu­nautés de micro-organ­ismes, mais sa mise en œuvre est plus lourde. Elle con­siste à récupér­er tout l’ADN con­tenu dans un échan­til­lon, le frag­menter pour obtenir des morceaux assez courts pour être séquencés, séquencer l’ensemble de ces por­tions de génomes puis recon­stituer au mieux les génomes d’origine.

Cela revient à pren­dre plusieurs puz­zles, en mélanger toutes les pièces (avec quelques pertes) puis essay­er de recon­stituer chaque puz­zle à par­tir de ce tas dis­parate. Pour les organ­ismes dont les génomes sont déjà réper­toriés, c’est rel­a­tive­ment facile car on a des mod­èles à suiv­re. C’est plus déli­cat pour les organ­ismes incon­nus, qui peu­vent représen­ter 90 % de cer­tains échan­til­lons7. Des astuces ont été imag­inées pour faciliter la réso­lu­tion de ce casse-tête8 9, mais la majeure par­tie de la bio­di­ver­sité micro­scopique nous est encore incon­nue : la métagénomique per­met tout juste de com­mencer à la défrich­er en mesurant l’ampleur de notre ignorance. 

Métagénomique et bioprospection

Cela dit, cette approche n’est pas seule­ment descrip­tive, elle ouvre aus­si de nou­velles pos­si­bil­ités pour iden­ti­fi­er des com­posés micro­bi­ens act­ifs. En effet, après frag­men­ta­tion des génomes présents dans un échan­til­lon, on peut pro­duire des bac­téries con­tenant cha­cune un des morceaux d’ADN obtenus et voir si cer­taines acquièrent une capac­ité intéres­sante (récupér­er telle souche d’énergie, dégrad­er tels com­posés, avoir une activ­ité antibi­o­tique…). Le tout sans cul­tiv­er, ni même iden­ti­fi­er, les organ­ismes qui pos­sé­daient cette com­pé­tence au départ !

Au-delà de la recherche fon­da­men­tale, le ver­sant fonc­tion­nel de la métagénomique élar­git donc le champ de la bio­prospec­tion. Cela reste de la métagénomique, coû­teuse et lourde à met­tre en place… Mais appelée à se dévelop­per au fil des pro­grès tech­nologiques. L’existence d’applications directes dans des domaines aus­si fon­da­men­taux que la médecine et l’agronomie con­stitue une rai­son sup­plé­men­taire de suiv­re les avancées de la métagénomique et les décou­vertes asso­ciées dans les années à venir.

1https://www.cell.com/cell-chemical-biology/pdf/S1074-5521(98)90108–9.pdf
2https://​www​.nature​.com/​a​r​t​i​c​l​e​s​/​2​6​5​687a0
3https://​pubmed​.ncbi​.nlm​.nih​.gov/​7​5​4​2800/
4https://​pubmed​.ncbi​.nlm​.nih​.gov/​8​8​4​9441/
5https://​www​.genome​.gov/​h​u​m​a​n​-​g​e​n​o​m​e​-​p​r​oject
6https://​www​.medeci​ne​sciences​.org/​e​n​/​a​r​t​i​c​l​e​s​/​m​e​d​s​c​i​/​f​u​l​l​_​h​t​m​l​/​2​0​2​2​/​0​6​/​m​s​c​2​2​0​1​0​4​/​m​s​c​2​2​0​1​0​4​.html
7https://​www​.sci​encedi​rect​.com/​s​c​i​e​n​c​e​/​a​r​t​i​c​l​e​/​a​b​s​/​p​i​i​/​S​0​1​6​8​1​7​0​2​1​6​3​08012
8En cher­chant des mod­èles dans les séquences virales inté­grées dans les génomes d’autres organ­ismes qui, eux, ont été séquencés : https://​www​.ncbi​.nlm​.nih​.gov/​p​m​c​/​a​r​t​i​c​l​e​s​/​P​M​C​6​9​6​6834/
9En com­bi­nant dif­férents jeux de don­nées métagénomiques pour chercher des frag­ments dont le nom­bre d’exemplaires est com­pa­ra­ble : https://​www​.ncbi​.nlm​.nih​.gov/​p​m​c​/​a​r​t​i​c​l​e​s​/​P​M​C​4​1​1​1155/

Le monde expliqué par la science. Une fois par semaine, dans votre boîte mail.

Recevoir la newsletter