L’aventure du séquençage du génome humain

Depuis 2001, la séquence du génome humain est connue. On peut maintenant séquencer plusieurs milliards de nucléotides en quelques jours. Autrement dit, on peut traduire un être humain en une immense combinaison de ATCG. Tu veux en savoir plus sur l’aventure du séquençage ?

Une chronique de Pierre Charrier

Lire la chronique

Génome, ADN, chromosomes ces trois mots décrivent une même longue molécule au cœur de nos cellules.

L’ ADN est une longue chaîne de plus petits éléments. Petits éléments que l’on appelle des nucléotides. Séquencer… c’est lire l’enchaînement de ces nucléotides.

En retournant aux sources : l’évolution de la vie et la transmission des caractères des parents aux enfants (Mandel, Darwin et Griffith), on comprend mieux pourquoi la molécule d’ADN est au centre des préoccupations. F. Crick et consort (n’oublions pas Rosalind Franklin, laissée sur le carreau) ont donc mis en lumière la structure de cette molécule. Restait encore à pouvoir lire l’ADN. C’est là qu’entre en scène un personnage important pour notre histoire : Fred Sanger.

Fred Sanger est un chimiste déjà très connu pour ces travaux sur le séquençage des protéines. Il s’est naturellement attaqué au problème de l’ADN. On est au début des années 60 et d’autres équipes dans le monde commencent déjà à séquencer l’ARN, une forme simplifiée de l’ADN.

Il faut s’imaginer la chose, grossièrement vous coupez la molécule nucléotide par nucléotide, vous faites une ingénieuse manipulation pour déterminer le nucléotide (est-ce un A, T, C ou un G ?) et vous recommencez. Bien sur chaque petite étape prend plusieurs heures voir plusieurs jours.

Mais en 1975, le père Sanger publie une méthode qui permet de lire jusqu’à (révolution) … 80 nucléotides (nt) d’un coup !!!! Wouhou comme des fous ils séquencent le premier génome ADN (5 380 nt quand même) ! Et bim bam boum en 1977 est publié la méthode dite de Sanger qui optimise tout ça. C’est la folie ! A partir de là, les méthodes fleurissent sur la base de celle de Sanger, des machines qui semi-automatisent le séquençage arrivent. En 1986 on peut séquencer des fragments de 400nt [5].

C’est à cette même période que le projet de séquençage du génome humain naît. Les scientifiques de cette époque savent déjà que le génome humain c’est environ 3 milliards de nucléotides, répartis en 23 molécules ou chromosomes… J’espère que vous imaginez le bazar que ça représente : 3 milliards de caractères. Laissez moi vous l’illustrer : le code du travail français ce n’est que 7 millions de caractères pour un total de 3 040 pages… Le génome humain ce serait donc un immense texte d’1 million 300 000 pages… Ça y est je crois que vous voyez l’ampleur de la tâche.

Mais ça ne leurs fait pas peur et en 1990, un consortium international qui repose sur une armée de stagiaires avec des micropipettes, des BAC et des YAC pour équipement se lancent dans un projet de 15 ans (c’est ce qui était écrit sur le papier).

Les technologies se développent, les machines deviennent capables de générer rapidement de multiples séquences. Mais la stratégie dite hiérarchique est un travail de fourmis. C’est en partie pour ça qu’un excité du nom de Craig Venter s’est lancé dans l’aventure. Il a monté une boite de biotech « Celera Genomics », en partie parce qu’il trouvait que ça n’allait pas assez vite tout autant que par la manne financière que pourrait rapporter les brevets biomédicaux.

L’apparition de Craig Venter sur la scène et le risque de voir des parties du génome humain brevetées donne un coup de fouet à tout le monde. Avec 4 ans d’avance, en 2001, le brouillon du génome humain est publié à un jour d’intervalle par le consortium publique et Celera Genomics. On parle de 83% du génome. En 2003, certaines régions récalcitrantes sont publiées ce qui fait monter le score à 92 % et en 2006 tout est bouclé !

Alors en bon esprit critique que vous êtes, vous devez surement vous posez la question de la confiance que l’on peut avoir en cette séquence….

Sachez qu’en 2004 un projet indépendant de vérification des données a montré que la précision de 99,99 % annoncée était bien respectée.

Et maintenant quoi… Si vous prenez une machine HiSeq3000, vous préparez vos échantillons, vous les mettez dans la machine et vous revenez 2, 3 jours et plus tard et vous récupérez jusqu’à 700 milliards de nucléotides d’un coup, en un run.  Il faudra débourser la somme deux à trois milles euros pour un huitième de ce total. Sacré révolution n’est-ce pas ? Je n’en ai pas parlé mais la technologie minION est aussi une technologie incroyable (prononcer minAîone with the very goud ingleash accente)… Mais c’est une chronique radio je ne peux pas vous parler de tout alors je vous laisse les liens pour vous renseigner. Allez voir, on séquence dans l’espace maintenant.

L’aventure du séquençage est peut être terminée mais l’annotation et la compréhension de tout ce bazar ne fait que commencer…

Ce domaine n’attend que vous pour taper sur le clavier de vos ordinateurs et mieux comprendre de quels bois nous sommes faits… pardon de quel ADN.

Sources

  • Griffith F. The significance of Pneumococcal Types. Journal of Hygiene 1928 ; doi:101017/S0022172400031879
  • Sanger F, Coulson AR. A rapid method for determining sequence in DNA by primed synthesis with DNA polymerase. Journal of Molecular Biology 1975 ; doi: 10.1016/0022-2836(75)90213-2
  • Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. PNAS 1977 ; doi:10.1073/pnas.74.12.5463
  • Smith et al. Fluorescence detection in automated DNA sequence analysis. Nature 1986 ; doi:10.1038/321674a0
  • Gibson G, Muse SV. Précis de génomique. Edition deBoeck 2004.
  • International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature 2001 ; doi:10.1038/35057062
  • Venter JC et al. The sequence of the human genome. Science 2001 ; doi:10.1126/science.1058040
  • Schmutz et al. Quality assessment of the human genome sequence. Nature 2004 ; doi:10.1038/nature02390
  • https://emea.illumina.com/systems/sequencing-platforms/hiseq-3000-4000/specifications.html
  • https://nanoporetech.com/products/minion
  • https://www.nasa.gov/mission_pages/station/research/news/dna_sequencing