Des théories informatiques pour traduire le “langage” des protéines

Article
Par · 07/12/2012

Quel est le point commun entre biologie, traitement automatique du langage et machine learning (apprentissage automatique)? Réponse: une communication qui s’exprime au travers d’un langage, ou tout au moins d’un codage de messages.

Elisa Cilia et Tom Lenaerts, deux chercheurs de l’ULB, attachés au département Machine learning, ont co-rédigé (avec un collègue de l’université de Leicester) un article dans la revue scientifique en-ligne Computational Biology de la PLoS (Public Library of Science) dans lequel ils expliquent comment certaines techniques informatiques permettent d’identifier des motifs de communication au sein des protéines. Le “langage des cellules biologiques” se construit en fait sur la base des changements dynamiques qui interviennent dans les structures protéiques en fonction des interactions entre protéines. Ces modifications opèrent ainsi à la manière de signaux ou de “motifs de communication dynamiques.”

En identifiant ces “motifs phonétiques”, il devient possible de “prédire quels acides aminés sont impliqués dans l’envoi d’informations à travers la structure protéique.”

En décryptant donc le “langage” des protéines, les scientifiques espèrent mieux comprendre leur fonctionnement et leurs interactions et mieux prévoir la survenance (ou la propension au développement) de maladies en fonction de la manière dont les protéines “communiquent” entre elles. Un “chahut” dans les échanges serait par exemple révélateur de distorsion de fonctionnement dans la communication de messages, signe de mutation dans la structure protéique et, dès lors, de risque de développement de maladie.

La technique utilisée pour cette identification de messages? La théorie de l’information de Shannon,  théorie probabiliste élaborée par Claude Shannon qui “permet de quantifier le contenu moyen en information d’un ensemble de messages, dont le codage informatique satisfait une distribution statistique précise” (source de la définition: Wikipedia).