AWS adapte le Machine Learning à la recherche de données médicales

CORD-19, le moteur de recherche médical d'AWS

La filiale Cloud d’Amazon, AWS, lance CORD-19 Search à destination de la communauté médicale. La plateforme exploite l’intelligence artificielle (Machine Learning) pour permettre des recherches de publications médicales en langage naturel.

Les géants du numériques mobilisent leurs services technologiques au bénéfice de la recherche sur le Covid-19. Cette crise pourrait constituer une opportunité commerciale pour ces acteurs d’entrer dans un secteur encore réticent à adopter des solutions cloud.

AWS annonce ainsi le lancement de CORD-19 Search. Ce service de recherche est basé sur le machine learning. Le moteur de recherche promet de fournir rapidement aux scientifiques un accès à des dizaines de milliers de publications médicales. Les recherches s’effectuent en langage naturel.  

Recherche en langage naturel dans un data lake de données Covid-19

La firme souligne que le nombre d’études menées sur le Covid-19 enregistre une « croissance exponentielle ». La conséquence : une assimilation et une analyse des informations sur le sujet rendues plus complexes.

« La plateforme CORD-19 Search aide les chercheurs à naviguer dans ce corpus de littérature sur le coronavirus leur permettant d’identifier efficacement des informations pertinentes et actualisées, en s’appuyant sur un ensemble de donnée contenant près de 47 000 documents et articles de recherche, compilé par l’Institut Allen pour l’IA (AI2) » détaille AWS.

Architecture du service de recherche CORD-19 d’AWS

Pour répondre à cette problématique, la solution exploite différents services d’AWS, dont Amazon Comprehend Medical et Kendra. La première brique fournit la compréhension des informations médicales et le traitement du langage naturel.

Elle permet ainsi, grâce à du machine learning, d’effectuer des recherches en langage naturel et d’extraire des informations médicales pertinentes à partir de textes non structurés. Amazon Kendra est quant à lui un service de recherche d’entreprise. Il assure l’indexation des données disponibles, grâce notamment à du machine learning.

Les données enrichies d’Amazon Comprehend Medical et la recherche Amazon Kendra sont construites à partir des données disponibles dans le data lake public AWS COVID-19.

Amazon prévoit à long terme de développer des fonctionnalités supplémentaires sur la base de l’architecture de recherche de CORD-19. Le fournisseur envisage ainsi d’intégrer des sources de données hétérogènes, y compris des données de recherche clinique.

AWS estime que cela permettra aux chercheurs du monde entier d’agréger des modèles de progression de la maladie spécifiques aux patients, de fournir des décisions fondées sur les données (data driven) et de dégager un impact positif sur les résultats des patients.

A propos de Christophe Auffray 268 Articles
De formation initiale en marketing Web et en économie, je me suis spécialisé par la suite dans la presse B2B consacrée à l'économie numérique et dispose dans ce secteur de 15 ans d'expérience. Spécialiste de la transformation numérique, de l'innovation et des nouveaux business models des entreprises, j'ai développé des compétences dans les domaines du marketing éditorial, de la stratégie éditoriale, de la production de contenus premium et la gestion de sites d'information et d'équipe dans l'univers des médias en ligne et du marketing des solutions innovantes.