HealthLake, le data lake Cloud d’Amazon pour les données de santé

HealthLake, le data lake Cloud d’Amazon pour les données de santé

Amazon poursuit son développement dans l’informatique de santé. Après CORD-19 Search, AWS lance HealthLake, son data lake optimisé pour le traitement des données de santé.

Selon Amazon, les projets Data dans le domaine de la santé se heurtent notamment à la dissémination des données et à l’hétérogénéité des formats. Cela se traduit par un allongement du temps nécessaire à la préparation et au traitement des données.

Face à ce point de douleur de l’industrie, AWS répond donc avec une nouvelle solution cloud, pour le moment en préversion. Avec HealthLake, la firme dégaine donc un data lake visant prestataires de soins, compagnies d’assurance maladie et entreprises pharmaceutiques.

Une réponse au problème de structuration des données de santé

Cet espace de stockage dans le cloud doit ainsi leur permettre de stocker, transformer, interroger et analyser de très grands volumes de données. La solution ne se veut toutefois pas un simple entrepôt de données.

HealthLake s’affirme comme une réponse au problème de la structuration des données. « Amazon HealthLake supprime la lourde tâche d’organiser, d’indexer et de structurer les informations sur les patients afin de fournir une vue complète » de leur santé, revendique le fournisseur.

Amazon HealthLake

Par le biais d’API, les entreprises et organismes de santé peuvent donc copier leurs données conformément au standard Fast Healthcare Interoperability Resources. Le transfert s’effectue depuis des systèmes on-premise vers le data lake dans le cloud.

AWS applique par ailleurs du machine learning afin de transformer les données non structurées. Il s’agira par exemple de traitement du langage naturel. L’objectif consistera à extraire automatiquement des informations médicales des données.

Des données exploitables grâce à des modèles d’IA

Outre le stockage, le géant américain met à disposition des modèles d’intelligence artificielle afin d’analyser les données stockées. Il s’agira notamment d’analyser « et comprendre les relations, identifier les tendances et faire des prévisions à partir des données. »

« De la détection précoce des maladies aux tendances de la santé de la population, les organisations peuvent utiliser Amazon HealthLake pour effectuer des analyses de données cliniques grâce à l’apprentissage automatique afin d’améliorer les soins et de réduire les coûts » souligne AWS.

De manière opérationnelle, HealthLake intervient donc pour extraire automatiquement des informations médicales de données brutes et disparates. AWS estime ainsi révolutionner un processus « traditionnellement manuel, sujet aux erreurs et coûteux ».

Le fournisseur insiste également sur l’interopérabilité. Il s’agit ainsi de garantir que les données de santé sont partagées dans un format cohérent et compatible entre plusieurs applications. « Amazon HealthLake crée une vue complète et chronologique des antécédents médicaux de chaque patient, et la structure dans le format standard FHIR pour faciliter l’échange d’informations. »

A lire également sur MyData

Data du jour : le télétravail ouvert à 100% des salariés de la Maif

La Maif, assureur de référence dans le NLP, veut fédérer autour de Melusine

C’est l’échec d’un projet de classification des emails qui a conduit la Maif à développer son propre outil de traitement du langage naturel pour ses cas d’usage du NLP dans l’assurance. Melusine est aujourd’hui accessible à tous. Et Maif compte sur l’open source pour fédérer et l’enrichir.

A propos de Christophe Auffray 433 Articles
De formation initiale en marketing Web et en économie, je me suis spécialisé par la suite dans la presse B2B consacrée à l'économie numérique et dispose dans ce secteur de 15 ans d'expérience. Spécialiste de la transformation numérique, de l'innovation et des nouveaux business models des entreprises, j'ai développé des compétences dans les domaines du marketing éditorial, de la stratégie éditoriale, de la production de contenus premium et la gestion de sites d'information et d'équipe dans l'univers des médias en ligne et du marketing des solutions innovantes.