Comment la puissance des processeurs bouleverse la recherche génétique en agronomie

Les stations de travail sont aujourd’hui portables, rackables, voire destinées à une activité spécifique comme le graphisme avec le modèle Canvas chez Dell par exemple. Cette évolution de la forme de ces ordinateurs surpuissants ne doit cependant pas faire oublier que c’est sous le capot que l’on trouve les avancées techniques majeures qui bouleversent les métiers et les pratiques.

 

L’étude de l’ADN des organismes vivants s’effectue par séquençage génétique, puis par analyse des résultats. Une analyse effectuée par des stations de travail.

Prenez la recherche scientifique. Au centre de recherche de l’INRA (Institut National de la Recherche Agronomique) de Bordeaux, une équipe travaille sur la sécurité alimentaire des céréales en analysant l’ADN de certains champignon qui posent des risques potentiel pour la santé des humains et des animaux (Mycolgie & Sécurité des aliments (MYCSA)).

« Quand un chercheur vous dit qu’il travaille sur un fichier texte, vous vous méfiez un peu quand même » sourit Lionel Million, chef de projet à l’INRA. De fait, il se retrouve régulièrement a devoir traiter un fichier texte de 15 Go (compressé à 4 Go) qui lui parvient sur clé USB. Il s’agit du séquençage génétique d’un gène de champignon par exemple. « Pas possible d’ouvrir ça avec Windows », dit-il, soulignant que « l’enjeu pour les informaticiens, c’est d’être en première ligne avec le chercheur, et interpréter les besoins pour aller voir les fournisseurs informatiques ».

Effondrement des temps nécessaires aux calculs

Linux en main, à lui la charge de lancer le calcul d’analyse statistique de millions de lignes qui portent sur les 4 lettres de l’ADN : ATCG. Un travail de 400 millions de lectures. A ce jour, 12 fichiers sont analysés par manipulation. Un travail qui prend à peu près 5 heures de calcul (sur une machine de 5 ans d’âge).

5 heures, c’est peu par rapport à ce qui était proposé par l’état de l’art de la puissance de calcul il y a 15 ans. « A cette époque, pour sortir quelques gênes, il fallait 3 ans » dit-il, notant désormais que l’équipe de recherche travaille aujourd’hui sur 15.000 gênes.

Mais c’est énorme par rapport à ce que propose la prochaine génération de station de travail, gavée de bi-processeurs Xeon (à noter que sur d’autres types de travaux, l’évolution des cartes graphiques assure des bénéfices équivalents). « Nous avons pu tester une station de travail, et réaliser en 2 minutes des calculs d’alignement de lectures de séquençage du génome. En un mois nous avons fait l’équivalent d’un an de calculs ! » dit-il.

« Tous les deux-trois ans on a une rupture de ce type » ajoute t-il. « Cela permet aux chercheurs d’aller plus vite dans les phases de calcul, de traiter plus de sujets, et d’être donc plus réactifs sur les sujets de sécurité alimentaire.

ZDNet