Emilie Dedieu
Le système d’alerte permettant de détecter au plus tôt les variants à haut risque du SARS-CoV-2 présenté le 14 janvier par InstaDeep et BioNTech combine intelligence artificielle et modélisation biostructurelle. Baptisé Early Warning System, il a identifié au cours de l’an passé 12 des 13 variants mis sous surveillance par l’OMS, en moyenne deux mois avant leur signalement, revendiquent ses concepteurs.
« Le jour où nous avons uploadé le séquençage de ce qui allait devenir le variant Omicron, tous nos voyants sont passés au rouge immédiatement », se remémore Karim Beguir, PDG et co-Fondateur d’InstaDeep. Avec sa start-up, fondée en 2014, il travaille depuis fin 2020 en partenariat avec BioNTech pour concevoir un système d’alerte, capable d’identifier le plus en amont possible les variants du SARS-Cov 2 susceptibles d’être à haut risque. Le 14 janvier, les deux sociétés ont annoncé le succès du projet, nommé « Early Warning System » (EWS), développé grâce à une combinaison d’intelligence artificielle et de modélisation biostructurelle.
Identifier les variants en amont
Lancé depuis 11 mois, EWS a réussi à identifier douze des treize variants que l’Organisation Mondiale de la Santé a mis sous surveillance, en moyenne deux mois avant leur signalement. « C’est impressionnant, commente Karim Beguir, parce que si en septembre 2020 nous recensions 300 nouveaux variants par semaine, en décembre 2021, c’était entre 10 000 et 12 000. » Des données sans cesse croissantes, en provenance de la totalité du globe, qui compliquent le suivi de la pandémie.
EWS utilise deux indicateurs pour repérer les variants à haut risque : leur potentiel infectieux et leur risque d’échappement immunitaire. Pour son développement, les ingénieurs se sont reposés sur une approche complémentaire entre, d’une part, la simulation structurelle des interactions entre la protéine Spike et les cellules hôtes pour mesurer la réponse immunitaire, et d’autre part, une modélisation prédictive basée sur l’intelligence artificielle pour estimer la contagiosité. Pour cette dernière partie, InstaDeep a fait intervenir sa plateforme d’IA « DeepChain » dédiée aux protéines.
Une analyse “sémantique”
Basée sur un apprentissage dit auto-supervisé, cette IA permet une analyse de séquence. « Ce type d’IA était initialement entrainé pour analyser des langages humains. Mais elles permettent avant tout des analyses de séquences, et finalement, l’ADN et les protéines sont respectivement des séquences de nucléotides et d’acides aminés. », détaille Karim Beguir.
Chaque protéine peut être décomposée en une « phrase » de vingt « mots » de manière à trouver leur « sens sémantique ». « Nous avons également repris des modèles entraînés sur l’ensemble de la biosphère – avec près de 700 millions de paramètres – que nous avons ensuite spécialisés pour le SARS-CoV 2. », explique Karim Beguir. Faire tourner EWS n’est toutefois pas chose aisée, et nécessite un supercalculateur à base de GPU.
Note: This article have been indexed to our site. We do not claim legitimacy, ownership or copyright of any of the content above. To see the article at original source Click Here