Des questions, un projet ?

Vous êtes :
Photo de Logan Voss

Comment l’intelligence artificielle transforme et accélère la structuration des données de diagnostic ?

Impulse by ICO, l’accélérateur d’innovation en oncologie de l’ICO (l’Institut de Cancérologie de l’Ouest) a pour ambition de révéler et accélérer les innovations pour améliorer la vie des patients et le quotidien de ceux qui œuvrent à prévenir, détecter et guérir le cancer. Le programme d’expérimentation en santé numérique d’Impulse by ICO vise à prouver la valeur des solutions grâce à des expérimentation en vie réelle.

Le projet avec Circular-Lab s’inscrit dans ce programme d’expérimentation sur un cas d’usage concret : la structuration des données de diagnostic.

Un défi : l’hétérogénéité des données diagnostic

Aujourd’hui, la médecine de précision révolutionne le traitement du cancer en proposant des thérapies adaptées aux caractéristiques biologiques de chaque tumeur. L’un des enjeux majeurs est l’identification précise des biomarqueurs tumoraux qui oriente les choix thérapeutiques.

Dans le parcours de soin, les laboratoires d’anatomopathologie sont au premier plan dans l’identification de ces biomarqueurs, dont les résultats sont consignés au sein de comptes rendus contenant des informations essentielles, aussi bien pour le suivi et la prise en charge des patients que pour la recherche clinique. Cependant, la structure de ces comptes rendus varie : certains sont bien formalisés, standardisés, structurés, d’autres contiennent du texte libre ce qui complique leur exploitation. Le manque d’uniformité dans la présentation des résultats rend difficile l’extraction et l’utilisation efficace des données. Ce constat soulève un défi majeur pour les établissements de santé et les chercheurs qui souhaitent utiliser ces informations dans des études en vie réelle et pour améliorer les prises en charge.

Dans ce contexte, l’ICO, via son programme d’expérimentation en santé numérique, a mené une étude en vie réelle pour démontrer l’apport de l’intelligence artificielle (IA) dans l’analyse des comptes rendus anatomopathologies. Cette étude illustre concrètement comment les technologies d’intelligence artificielle peuvent structurer et exploiter efficacement des données cliniques complexes.

Une étude en vie réelle et de premiers résultats prometteurs

Face à ces défis, l’ICO a testé une solution innovante, la plateforme d’intelligence artificielle C-LAB®, développée par Connect by Circular-Lab.

L’étude en vie réelle avait pour objectif de comparer les performances d’extraction et de structuration des données par C-LAB®.  Pour évaluer la fiabilité de C-LAB®, le service Data Factory & Analytics a comparé les résultats extraits à la base de données nationale ESME, référence en matière de suivi des cancers du sein métastatiques et saisie manuellement.

L’ICO dispose d’un référentiel clinique comprenant près de 10 millions de textes en français, avec 650 000 nouveaux comptes rendus ajoutés chaque année. Pour cette étude, 2 323 comptes rendus anatomopathologiques, provenant des dossiers patients de 487 patients atteints de cancer du sein, ont été analysés par la plateforme C-LAB®. Ces documents, provenant de différents laboratoires des Pays de la Loire, présentent une grande variabilité dans leur structure, rendant leur exploitation complexe. L’étude a été menée en 2022 sur la base de comptes rendus rétrospectifs de patientes suivies à l’ICO entre janvier 2014 et décembre 2021

Les analyses ont porté sur quatre biomarqueurs clés : HER2, ISH, récepteurs aux œstrogènes (ER) et récepteurs à la progestérone (PR).

L’évaluation des résultats de la solution de C-LAB® a mis en évidence plusieurs bénéfices majeurs :

  • Près de 80 % de précision pour l’extraction et la structuration des résultats des biomarqueurs clés (récepteurs hormonaux et HER2).
  • Un potentiel significatif pour réduire la charge de travail manuelle, centraliser les données et permettre une production de rapports évolutive et en temps réel

Cependant, certains défis persistent, notamment pour les tests ISH, plus complexes à traiter par IA. L’étude souligne également l’importance d’une validation continue des données pour améliorer la fiabilité des modèles d’apprentissage automatique.

Bénéfices et perspectives

L’étude révèle que C-LAB® est un outil performant pour extraire automatiquement des données biomédicales à partir de comptes rendus médicaux. Bien que des ajustements restent nécessaires, notamment pour améliorer la reconnaissance de certaines données complexes, ces résultats démontrent que l’IA peut apporter une valeur ajoutée significative dans la structuration des données en oncologie. L’automatisation et la structuration des données pathologiques ouvrent des perspectives majeures :

  • Un accès plus rapide aux informations simplifiant la prise en charge des patients.
  • Une meilleure analyse des traitements et une amélioration de la prise en charge des patients atteints de cancer du sein
  • Une meilleure harmonisation des pratiques de diagnostic grâce à une standardisation des comptes rendus.
  • Une optimisation des recherches cliniques en facilitant l’analyse de grandes bases de données.

La finalité et les résultats de cette étude, mettant en lumière les bénéfices concrets de l’IA dans le traitement des données médicales et permettent, de manière très concrète, de tendre vers une simplification de la prise en charge des patients.

Camille Garnier, PhD, CSO (Chief Scientific Officer) chez Circular-Lab

« L’ICO est un centre pionnier dans l’intégration de l’intelligence artificielle pour structurer et centraliser les données de santé, facilitant ainsi leur accessibilité et leur exploitation. Collaborer avec un centre de cette envergure, et membre du réseau UNICANCER, nous a permis de démontrer sur le terrain l’efficacité de C-LAB® en automatisant et en fiabilisant l’extraction et l’harmonisation des données de biomarqueurs oncologiques à partir des comptes rendus d’anatomopathologie. L’implication des équipes de l’ICO tout au long du projet, notamment dans l’analyse comparative avec la base de référence ESME initiée par le réseau UNICANCER, a été essentielle pour valider notre approche. Ce partenariat renforce notre engagement à proposer des solutions innovantes pour la structuration et l’actionnabilité des données diagnostiques et ouvre la voie à de nouvelles applications et pistes de travail en commun, notamment dans le suivi des classifications émergentes comme les tumeurs HER2-Faible et l’extension à d’autres indications et données cliniques. »

Pr. François Bocquet, PU-PH, PharmD., Chef du service Data Factory & Analytics

« Recourir à la data science dans un objectif de structuration de la donnée est un axe de travail stratégique pour l’ICO. Expérimenter des solutions technologiques comme celle de Circular-Lab nous permet de bénéficier de savoir-faire complémentaires aux nôtres, de s’ouvrir à d’autres approches, à l’international dans ce cas de figure et ainsi de monter en compétence. Dans un environnement technologique en pleine effervescence, où les approches Machine Learning et LLM se développent rapidement, cette étude apporte de premiers résultats, validés et qualifiés, que l’on peut considérer comme encourageants. Ils doivent cependant confirmés, approfondis par d’autres travaux complémentaires ».

lien vers la publication scientifique : Structuring and centralizing breast cancer real-world biomarker data from pathology reports through C-LAB® artificial intelligence platform – PMC

Crédit Photo : Logan Voss sur Unsplash