LA STRATÉGIE DATA IPC-crcm :
FAIRE PARLER LES DONNÉES POUR AMÉLIORER LES TRAITEMENTS

Projet financé avec le concours de l’Union européenne avec le Fonds Européen de Développement Régional (FEDER)

Une plateforme qui consolide les données de santé, les rend accessibles pour les analyser, les croiser, tout en corrélant des données épidémiologiques, médico-techniques, cliniques, de la recherche clinique… pour permettre d’accélérer la découverte de nouvelles cibles thérapeutiques, prédire l’effet des molécules et la réponse aux traitements, faire avancer la médecine de précision…, cela tient en quelques mots :

L’entrepôt des données de santé

Elément-clé, l’entrepôt de données est un outil d’avenir qui s’inscrit dans la stratégie numérique de l’organisation sanitaire.

Z

UN VIRAGE STRATÉGIQUE ET HISTORIQUE

En janvier 2017, c’est l’AP-HP (Assistance publique des Hôpitaux de Paris), avec ses 12 groupements d’hôpitaux représentant 39 hôpitaux, qui se dote d’un entrepôt de données. Le CHU de Nantes lui emboîte le pas en 2018, et l’année suivante, c’est le CHU de Lille qui le met en place.

Et IPC-CRCM est en passe de rejoindre le cercle très fermé des hôpitaux français qui disposent d’un entrepôt de données de santé !

Retenu par le FEDER (Fonds européen de développement régional), le projet vient de bénéficier d’un soutien financier de 2 417 500 € débloqués par la Région Sud. Cette subvention sera allouée aux dépenses d’infrastructures matérielle et logicielle. Le coût total de l’opération se chiffrera à 4 835 000 €.

Pourquoi un Entrepôt de données de santé (EDS) à l’IPC ?

« Pour moi, le mot-clé, c’est accélération. Il n’y a rien qu’on puisse faire sans un entrepôt de données, mais avec une lourdeur et une pénibilité incroyables à l’heure actuelle quand on est sur un mode manuel.

L’idée finalement, si l’on veut simplifier, ça va permettre d’automatiser tout un tas d’éléments qu’on mettait en place pour recueillir les données, les regrouper, les mettre en forme pour pouvoir les analyser. Dans notre domaine de la cancérologie, les informations qui sont nécessaires pour prendre une décision médicale ou pour évaluer les effets d’un nouveau traitement dans un essai clinique ou un nouveau biomarqueur proviennent de sources multiples. Et là, il y a un potentiel incroyable pour pouvoir mener des études dont on ne pouvait pas rêver auparavant.
» 
Pr Norbert VEY, Directeur général de l’Institut Paoli-Calmettes

C’EST QUOI AU JUSTE :
« UNE STRATÉGIE DATA » ?

Postopia, Oncosnipe, Objets connectés… Ce sont quelques-uns des projets innovants impulsés par le LIDAO (Laboratoire d’innovation digitale appliquée à l’oncologie), qui rappelons-le est une gouvernance assurée par une équipe pluridisciplinaire de médecins, chirurgiens, recherche clinique, recherche translationnelle, informaticiens ainsi que la direction générale.

Prenons le cas du projet Postopia. Grâce à des algorythmes d’intelligence artificielle effectués à partir de données, il permet de prédire les complications post-opératoires. A l’instar de Postopia, tous les projets de recherche nécessitent l’utilisation de données.

La donnée de santé, c’est l’élément de base, l’élément-clé qui permet de constituer des cohortes (ou groupes) pour comprendre le passé, prédire le futur. Et le besoin de données est prégnant, de même qu’un socle, un outil, pour identifier, stocker, normer, extraire, partager et analyser les données.

D’où le projet de Stratégie data, un entrepôt de données de santé, enjeu fondamental pour l’innovation diagnostique et thérapeutique.

Fréquence des effets secondaires, efficacité des médicaments,résistance de certains patients aux traitements… c’est la nature des informations recueillies chaque jour dans notre Centre et qui pourraient être exploitées de façon optimale afin de mieux connaître le cancer, faire avancer la recherche et améliorer les soins en cancérologie. Pour cela, un outil indispensable, les technologies du big data.

L’ENTREPÔT DE DONNÉES DE SANTÉ

COMMENT FONCTIONNERA-T-IL ?

Entrepôt de données de santé ou EDS, c’est ce qui désigne une base de données utilisée pour collecter ordonner, et stocker des informations provenant de bases de données opérationnelles et fournir ainsi un socle d’aide à la décision.

Y seront consacrés des moyens très importants avec la création d’un DataCenter fournissant des capacités de stockage et de calculs considérables et des logiciels à la pointe technologique dans le traitement et l’analyse des données.

Une équipe est mise en place à l’Institut Paoli-Calmettes pour mener à bien ces chantiers, composée de profils experts : architectes, ingénieurs spécialistes de la Data, référents médecins et métiers, DRCI.

Grâce à l’entrepôt de données de santé commun IPC (Institut Paoli-Calmettes)-CRCM (Centre de recherche en cancérologie de Marseille), le continuum recherche-soin sera assuré.

LA STRATÉGIE DATA, UN PROJET À 100 % IPC-CRCM

LES ÉTAPES, LE CALENDRIER

Le plan de financement prévoit un investissement massif en 2021, lors de la première tranche du projet, consacrée à sa mise en œuvre.

Les investissements en matière de prestations intellectuelles perdureront jusqu’à la livraison du chantier, prévue le 31 décembre 2023.

CONSORE, OSIRIS : DEUX EXPÉRIENCES RÉUSSIES SUR LESQUELLES VIENDRA S’ADOSSER LE PROJET IPC-crcm

A

CONSORE POUR IDENTIFIER DES COHORTES

Bien qu’exclusivement développé par IPC-CRCM, le projet s’appuiera sur l’expérience acquise par les équipes de l’Institut sur le projet ConSore, Continuum Soins Recherche, un moteur de recherche pour le big data en cancérologie, développé par Unicancer. Ce puissant outil de recherche permet de retrouver des informations disséminées dans le texte de centaines de milliers de dossiers des patients des CLCC et de constituer des cohortes (groupes) de patients.

L’analyse des données en santé est complexe du fait de la quantité et de la dispersion des informations dans de nombreuses bases et sources de données, structurées pour certaines, non structurées pour d’autres (comptes rendus et courriers). De plus, le codage de l’information n’est pas effectué de la même façon d’un établissement à un autre.

ConSoRe apporte une solution à la problématique de l’exploitation de la donnée, se voulant utile aux chercheurs, comme aux cliniciens. Il traite les données multi-formats, permet une recherche par critères multifactoriels (par sexe / âge / organe / traitements…), l’ajout de critères pour affiner la recherche et la construction de recherches élaborées. Avec cet outil, il est également possible d’enregistrer, organiser, traiter, transmettre et partager les résultats des recherches.

OSIRIS, LE LANGAGE DE LA CANCÉROLOGIE

Projet national initié par les Sites de recherche intégrée sur le cancer (SIRIC) labellisés par l’Institut national du cancer (INCa), OSIRIS, le GrOupe inter-SIRIC sur le paRtage et l’Intégration de données clinico-biologique en cancérologie, repose sur une terminologie commune à l’ensemble des partenaires du groupe dont fait partie IPC-CRCM.

Il s’agit en quelque sorte d’un langage universel utilisé dans le cadre de la cancérologie par les différents partenaires.
Ce projet ambitionne de s’ouvrir à d’autres centres et d’accélérer la recherche sur le cancer grâce au partage et à l’utilisation des données de santé

POUR CET ENTREPÔT, UN STANDARD INTERNATIONAL : FHIR®

FHIR®, est la prochaine norme dans le monde de la santé vue comme la solution permettant de développer et d’implémenter plus simplement et rapidement l’interopérabilité de la santé. Utilisée par les établissements de santé de renom comme l’hôpital John Hopkins, le centre médical Cedars-Sinai et les grands éditeurs informatiques aux Etats-Unis, cette norme deviendra obligatoire aux Etats-unis en 2021.

En France, le standard FHIR® est en pleine expansion, notamment au sein des éditeurs comme Doctolib, Vidal, Enovacom et des centres et institutions comme l’AP-HP, l’Institut Curie, le CLB, l’INCa. L’utilisation de la norme HL7 FHIR est privilégiée par l’Agence nationale de Santé publique dans le cadre d’interopérabilité des systèmes d’information de santé.

T

QUELQUES CHIFFRES

Budget : 4 835 000 €

Apport FEDER : 2 417 500 €

Durée du projet : 2,5 ans

Sources de données : +20

DataCenter : 2 Datacenters sur 2 lieux différents

Puissance de calcul : 10 serveurs applicatifs – un cluster de dernière génération de 4 serveurs de calcul scientifique

Puissance de stockage : 800 téraoctets de données

Environnement logiciel dernière génération : FHIR, NoSQL, BigData, Jupyter notebook (Python, R) pour la datascience

I

LE FEDER, QU’EST-CE QUE C’EST ?

Le FEDER est un Fonds européen de développement régional qui s’inscrit dans le cadre d’une politique de cohésion économique, sociale et territoriale.

La recherche, le développement technologique et l’innovation, le développement des technologies de l’information et de la communication…font partie des thématiques soutenues par le Fonds européen de développement régional (FEDER). Le FEDER, c’est 8,4 milliards d’euros de budget annuel.

Parmi les fonds européens, on retrouve le FEAMP, le Fonds européen pour les affaires maritimes et la pêche, le FEADER, le Fonds européen pour le développement rural, le FSE, le Fonds social européen. La gestion du FEDER est confiée aux conseils régionaux.