Le Big Data dans la santé vu par Stéphane Schück de Kappa Santé

inhalateur

Médecin de santé publique et épidémiologiste de formation, Stéphane Schück a fondé et dirige la société Kappa Santé depuis 2003. Kappa Santé étudie l’impact des médicaments sur la santé des populations. Pour cela, la trentaine d’employés de cette société collecte des données provenant de sources variées telles que des objets connectés dans le domaine de la santé, des bases de données de santé comme celle du remboursement de l’Assurance Maladie fournie par le SNIIRAM, des données génétiques ou empreinte numérique des patients. Pour Kappa Santé, c’est le croisement de ces données avec des protocoles de recherche qui permet, après analyse, de pouvoir en tirer une information.

Stephane

Que représente pour vous le Big Data ?

Le Big Data c’est avant tout une question d’hétérogénéité des données provenant de sources variées comme les capteurs, les bases de données de santé mais aussi le patient en lui-même grâce aux données extraites du mapping du génome. On collecte des données auxquelles on n’avait pas accès jusqu’alors car on ne savait pas les mesurer ou on ne savait pas les diffuser. C’est une richesse inouïe.

Cela a aussi changé jusqu’à la façon même de faire de la recherche dont le principe directeur était d’avoir une hypothèse, puis de l’affirmer ou l’infirmer par l’expérimentation. Désormais, on a d’abord accès à des données, puis on cherche à les interpréter.

 

Le Big Data est une notion explorée en santé depuis de nombreuses années. Historiquement, on pourrait retracer sa première utilisation à l’étude du Docteur John Snow menée dans les années 1850 qui avait permis de déterminer les modes de propagation du choléra à Londres en croisant les données géographiques de la propagation de la maladie et des dessertes des compagnies distributrices d’eau.

Cholera

http://googlemapsmania.blogspot.fr/2012/02/john-snows-cholera-map-on-google-maps.html

 

Quel est l’impact du Big Data sur la santé et le secteur médical aujourd’hui ?

Le Big Data apporte des informations précieuses pour l’épidémiologie. Si on prend l’exemple de l’asthme, grâce à des capteurs positionnés sur les inhalateurs des patients, on parvient à déterminer le moment exact de la crise, ainsi que la position GPS du patient durant l’épisode. En recroisant ces informations avec des données d’allergènes et de pollution, on pourrait établir des « clusters » à risque pour les personnes atteintes de cette maladie.

inhalateur

Connect’inh, inhalateur connecté pour accompagner les patients asthmatiques
http://blog-sante-numerique.com/connect-inh-inhalateur-connecte-asthme/

 

Concernant les réseaux sociaux et leur utilisation dans un cadre sanitaire, nous avons mis en place une solution, Detec’t, qui permet, en croisant plusieurs types de données et notamment des recherches sémantiques de retours d’expérience de patients sur les forums et réseaux sociaux, d’identifier 30% des signaux de pharmacovigilance liés à de nouveaux médicaments mis en ventes sur le marché plusieurs mois avant que les organismes de surveillance sanitaire ne s’en aperçoivent.

Dans le cadre du projet d’ampleur nationale PRESIDIO, nous cherchons à prédire l’arrivée d’une dépression chez les patients en collectant leurs données de navigation sur internet, en faisant une analyse sémantique de leurs messages sur les réseaux sociaux, en incluant des données de géolocalisation ainsi qu’en leur soumettant des questionnaires sur leur état moral et de santé.

On est encore en phase d’expérimentation et rien n’est figé mais on sait déjà que les gains du Big Data dans le domaine de la santé seront substantiels.

 

Quelles sont les problématiques que vous rencontrez lors de ces projets ?

La première difficulté réside dans la nature des données recueillies.  On fait face à une problématique de reproductibilité du modèle car, à chaque expérimentation, le jeu de données utilisé n’est jamais le même. Cela devient plus difficile de valider définitivement nos expériences.

On rencontre également des difficultés d’interprétation de la donnée : à partir du moment où l’on est capable de suivre des indicateurs de manière constante grâce à des capteurs connectés, comment détermine-t-on le seuil d’alerte ? La question du « bon niveau » se pose d’autant plus que les données recueillies ne sont pas toujours fiables à 100%. Si l’on prend l’exemple du podomètre, pas un capteur porté par le même patient n’aura le même compte en fin de journée. Dans le cadre d’actions de bien-être, cet enjeu a moins de conséquences qu’en santé où le seuil d’alerte peut mener à des actions médicales comme une prise de médicament ou un changement de stratégie thérapeutique.

La deuxième difficulté concerne l’accès aux données. Alors que certaines données comme les indices de pollution ou les données météorologiques sont en Open data, les bases de données officielles de santé comme celles du SNIIRAM demandent des procédures d’autorisation pouvant aller jusqu’à 8 mois de délais, en amont de projet. Ce système s’ouvre petit à petit mais les évolutions sont très lentes. Et pour cause, les données de santé sont des données extrêmement sensibles, extrêmement sécurisées qui sont anonymisées pour préserver les patients. Cependant, ce besoin d’anonymat est également bloquant dans nos recherches car le principe même de la médecine prédictive serait de pouvoir revenir vers le patient pour lui présenter les risques et pouvoir mettre en place des actions préventives.

 

Y a-t-il des risques à l’utilisation du Big Data dans le domaine de la santé ?

Le plus gros risque n’est pas dans la connaissance acquise mais dans l’utilisation de cette connaissance. Il y a un risque avéré de discrimination dû à l’état de santé. On pourrait stigmatiser les personnes à risque sanitaire, à l’image des assurances qui proposent des tarifs avantageux en fonction des données de santé. Une des dérives à envisager serait de ne plus prendre en charge les soins des personnes ayant adopté des comportements à risque identifiés. C’est pourquoi il est nécessaire de garder le contrôle sur les données exploitées et de rendre tous les éléments aveugles afin que la traçabilité ne puisse s’effectuer que dans le cadre d’un suivi médical.

 

Que doit-on retenir pour les prochaines années    ?

Il est important de ne pas succomber au fantasme disant que l’on va tout pouvoir prédire et tout pouvoir expliquer grâce aux nouvelles technologies et au Big Data. Ce n’est tout simplement pas le cas. Mais on va pouvoir aider des populations ciblées sur la prédiction d’événements de santé précis.

Les applications médicales sont déjà une grande avancée pour les praticiens et l’intelligence artificielle pour l’établissement de diagnostics est très attendue. Il ne reste plus qu’à faciliter l’accès aux données, que ce soit pour les bases de données officielles ou pour l’empreinte numérique des patients, qui devraient facilement donner leur accord si les prédictions établies sont fiables et utiles.

2 comments

  1. Pingback: Le Big Data dans la santé vu par St&eacu...

  2. Pingback: Le Big Data dans la santé vu par St&eacu...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *