Un logiciel développé par Illumina aide à trouver des extensions répétées pour faciliter la détection de maladies

21-11-2017

CHICAGO (GenomeWeb) - En collaboration avec des chercheurs en génétique aux Etats-Unis et en Europe, des scientifiques d'Illumina ont développé un logiciel qui identifie des expansions répétées dans des données génomiques afin d’aider à la détection précoce de maladies rares telles que la maladie de Huntington, la sclérose latérale amyotrophique, l'ataxie de Friedrich et le syndrome de l'X fragile. Basé sur les premiers résultats, le système, connu sous le nom ExpansionHunter, s'est avéré être d'une très grande précision.

Dans une étude présentée à la conférence sur l'informatique du génome de Cold Spring Harbor Laboratories (CSHL) ce mois-ci, ExpansionHunter a correctement identifié des expansions ou des expansions potentielles dans tous les échantillons de génome élargis de 212 patients SLA qui avaient été testés pour la mutation du gène C9orf72. Le système était aussi précis à 99,9% pour classer 2.789 autres échantillons du type sauvage et il a également balisé trois expansions potentielles, selon la présentation par affiche que la CSHL a publié dans sa revue Genome Research cet automne-ci.

Illumina a collaboré avec un consortium de recherche sur l'ADN appelé « Project MinE », qui a fourni des échantillons de 3.001 patients atteints de SLA. « On essaie de comprendre la base génétique de cette maladie, et les extensions répétées sont l'une des variantes importantes qui la provoque », a déclaré Egor Dolzhenko, un scientifique bioinformatique à Illumina.

« De prime abord, les modifications peuvent sembler subtils », mais la nouvelle génération de séquenceurs produit des résultats plus clairs que les anciennes versions. « Nous pouvons regarder à l'intérieur de toutes les régions, y compris de nombreuses régions que nous ne pouvions pas examiner auparavant », a déclaré Dolzhenko, qui a rejoint Illumina en mars 2016 pour diriger l'effort ExpansionHunter.

« En combinant un nouveau séquençage sans PCR (Polymerase Chain Reaction) avec des méthodes mathématiques précises, nous pouvons commencer à identifier des éléments antérieurement estimés impossibles à analyser », a expliqué Dolzhenko.

« Auparavant, on pensait que si on était atteint [d’une de ces maladies], il n’y avait plus d’espoir ... Maintenant, avec CRISPR et d'autres nouvelles technologies, on pourrait potentiellement guérir ces maladies, soit en réduire l'intensité », a-t-il poursuivi.

Illumina, basé à San Diego, a développé l'ExpansionHunter open-source pour scruter des données de séquençage du génome entier sans PCR et à lecture courte afin de détecter les extensions répétées bien avant l'apparition de symptômes perceptibles. ExpansionHunter permet d’exécuter des lectures à l'intérieur et à côté des extensions répétées, puis estime la taille des allèles corrélatifs à chaque répétition.

Illumina a mis le logiciel à la disposition de la communauté open-source il y a presque un an. D'autres développeurs ont construit des extensions ciblées sur des répétitions spécifiques, puis ont partagé leur travail avec d'autres utilisateurs de ExpansionHunter.

« ExpansionHunter pourrait être utilisé dans le contexte clinique par des personnes dans les laboratoires cliniques pour identifier des expansions spécifiques connues pour leur nature pathogène », a déclaré Dolzhenko. Une extension pourrait aider les académiciens à trouver des extensions répétées qui pourraient conduire à la découverte de nouveaux liens génétiques, a-t-il remarqué.

Une fonction supplémentaire dont Dolzhenko a dit qu'elle n'a pas encore été publiée peut effectuer une analyse génomique sans qu’elle sache où chercher des répétitions, ce qui nécessite évidemment beaucoup de puissance de calcul, mais néanmoins les analyses d'échantillons peuvent être exécutés sur un PC standard en quelques heures, sans avoir besoin d'installations informatiques à haute performance.

« Nous avons essayé de le rendre aussi efficace que possible », a déclaré Dolzhenko. « C'était un cas d'utilisation important pour moi. » Il a noté que le cloud Amazon Web Services facture en fonction de la puissance de calcul utilisée. Un processus plus efficace permet donc aux chercheurs d'économiser de l'argent en traitant de grandes cohortes de données.

 

Traduction : Ligue SLA : Walter

Source : GenomeWeb

Share