Rencontrez Stanislas, chercheur chez Dreem - Experts du sommeil - Dreem

Rencontrez Stanislas, chercheur chez Dreem

9min de lecture

Stanislas Chambon est doctorant au sein de l’équipe scientifique de Dreem. Il termine actuellement sa dernière année de thèse portant sur les problématiques du machine learning appliquées à l’EEG (ou électro-encéphalogramme, soit la mesure de l’activité électrique du cerveau). Chez Dreem, les recherches essentielles de Stanislas pour le développement et l’amélioration du bandeau ont été récemment publiées :

Chambon, S., Galtier, M., Arnal, P., Wainrib, G., & Gramfort, A. (2017). A deep learning architecture for temporal sleep stage classification using multivariate and multimodal time series. ArXiv:1707.03321 [Cs, q-Bio, Stat].

stanislas chambon

Afin de mieux comprendre les enjeux de cette publication, nous avons posé quelques questions à Stanislas :

Bonjour Stanislas, peux-tu nous parler un peu de ton parcours ?

J’ai découvert le machine learning en 2015, alors que je suivais un master de mathématiques en double diplôme à la Technische Universität München (TUM) et à l’École Polytechnique. Attiré par ce domaine, j’ai donc réalisé un stage au sein de Dreem où j’ai eu l’occasion d’appliquer mes connaissances en machine learning. Une fois mon master terminé, je suis ensuite revenu sur Paris pour entamer une thèse sous la direction Alexandre Gramfort, et prendre poste chez Dreem. Centrées sur le deep learning, mes recherches tendent à solutionner le problème du manque de données annotées grâce au transfer learning, avec pour objectif, l’amélioration des algorithmes.

Peux tu nous expliquer quels étaient les objectifs de cette étude ? Les hypothèses ?

Pour situer le contexte de cette recherche, il faut d’abord savoir que l’étude classique du sommeil s’effectue traditionnellement en milieu hospitalier. En effet, le patient porte un dispositif qui enregistre pendant la nuit l’activité électrique de son cerveau: l’électroencéphalogramme (EEG), l’activité électrique au niveau des yeux, l’électro-oculogramme (EOG) et l’activité électrique des muscles (du menton), mais aussi l’électromyogramme (EMG).

Les signaux enregistrés sont ensuite analysés par un expert médical. Sur des critères définis selon une nomenclature de référence (règle de l’AASM), celui-ci attribue un stade de sommeil à chaque période de 30 secondes :

  • éveil
  • les stades de sommeil léger (N1) et (N2)
  • la phase de sommeil paradoxal (SP)
  • et enfin le sommeil profond (N3)

Il s’agit d’une tâche répétitive et chronophage car chaque portion de 30 secondes de signal doit être analysée. De plus, elle dépend également de la subjectivité de l’expert.

Comment rendre cette tâche moins répétitive ?

Une alternative de plus en plus en vogue consiste à faire effectuer cette tâche par un ordinateur. C’est la classification automatique. Un algorithme de machine learning peut ainsi effectuer la tâche de façon à aider l’expert dans son diagnostic, voire le remplacer. Le but du jeu est alors de produire un algorithme le plus performant possible. C’est-à-dire un algorithme qui reproduit au mieux la décision du médecin ou d’un consensus de médecin.

Celle-ci repose sur le principe du machine learning. Le machine learning se passe en deux étapes :

  • la première consiste d’abord à extraire certaines caractéristiques du signal brut et créer une nouvelle représentation de ce signal.
  • les caractéristiques extraites sont ensuite données à un algorithme qui est entraîné à effectuer la tâche de classification de stades de sommeil. » cf. Figure 1.

Stanislas, quelles sont les différentes approches de machine learning qui peuvent vous aider dans cette tâche ? 

Les approches de machines learning peuvent être elles-mêmes catégorisées en deux sous-branches:

  • les approches traditionnelles. Elles reposent sur l’extraction de caractéristiques expertes (type moyenne du signal, déviation standard…). Ces approches reposent elles-mêmes sur une connaissance préalable du signal.
  • les approches deep learning. Elles reposent sur des algorithmes particuliers. « Les réseaux de neurones » d’abord, qui réalisent (1) l’extraction de caractéristiques ensuite et (2) enfin la classification en une seule et même procédure. Ces algorithmes sont particulièrement intéressants, car ils permettent d’obtenir une représentation du signal beaucoup plus riche que le machine learning traditionnel et aussi beaucoup plus appropriée à la tâche à effectuer ce qui les rend extrêmement performants sur de nombreuses tâches (reconnaissance d’image, de parole…)

Figure 1: principe du machine learning.

Cette étude porte sur la classification automatique de stade de sommeil à partir d’une méthode de deep learning. Elle propose une simple architecture qui intègre les informations de différents capteurs EEG, EOG et EMG. (cf Figure 2)

Figure 2: architecture de l’algorithme intégrant à la fois les signaux des capteurs EEG, EOG, EMG

Cette étude a pour but d’analyser l’influence des différents facteurs sur la performance de la méthode:

a. le nombre d’électrodes (EEG)
b. l’inclusion de données d’électrodes (EOG) et (EMG)
c. l’influence du contexte temporel* d’un échantillon de 30 secondes à classifier.
d. la quantité de données nécessaire pour entraîner un algorithme de classification.

*Contexte temporel: un expert du sommeil attribue un stade de sommeil à un échantillon de 30s en se basant sur les 30s qu’il voit mais aussi sur les décisions qu’il a prises concernant les échantillons précédant (dans la nuit). Ce qu’il a vu précédemment influence sa décision et doit être pris en compte d’une certaine manière par l’algorithme.

Sur quelles précédentes recherches vous êtes vous appuyés ?

Nous nous sommes principalement appuyés sur de nombreux travaux de recherche* s’attaquant à la classification automatique de stade de sommeil avec des méthodes de deep learning mais également sur des travaux traitant du traitement de signaux EEG avec des algorithmes de deep learning en général.

*Vous pourrez retrouver les références et liens de ces différents articles à la fin de l’interview. 

Quelles procédures avez-vous mis en place ?

Pour ce travail, nous avons dû
a. recueillir et extraire des données EEG ainsi que les annotations
b. choisir les métriques pour quantifier la performance des algorithmes étudiés
C. ré-implémenter des méthodes de l’état de l’art pour établir un benchmark.

Ces méthodes ont été ré-implémentées à partir de divers articles et recherches scientifiques*.

Quels résultats vous attendiez vous à découvrir ? Les résultats obtenus valident-ils vos hypothèses de départ ?

Nous avons pu montrer que le fait de travailler avec de nombreuses électrodes n’influence pas significativement les performances de l’algorithme. Un nombre restreint d’électrodes bien placées permet en effet à l’algorithme d’obtenir de bonnes performance, (cf Figure 3).

Figure 3: Influence du nombre d’électrodes EEG prises en compte par l’algorithme proposé et un algorithme de machine learning traditionnel.

De même, l’influence du contexte temporel sur la performance de l’algorithme se réduit. Cela se produit quand un certain nombre de signaux sont considérés (EEG, EOG, EMG). L’information “perdue” avec un nombre restreint d’électrodes peut-être alors compensée par le contexte temporel et inversement. Cela met en évidence plusieurs leviers d’action sur lesquels l’expérimentateur peut jouer comme par exemple :

  • le manque d’information spatiale (peu de channel EEG) peut être compensé. Il faut prendre en compte le contexte temporel de l’échantillon à classifier
  • et inversement, plus d’information spatiale compense le manque d’information sur le contexte temporel.

En quoi cette étude peut aider au développement du bandeau Dreem ?

Cela permet de mettre en place des procédures pour quantifier l’impact du nombre d’électrodes, leur position, l’incorporation de modalités supplémentaires (EOG, EMG…). Elle permet aussi de connaître les différents leviers sur lesquels on peut jouer sur le design du bandeau ou de certains algorithmes embarqués dans le bandeau.

Quelles sont les prochaines étapes ? Prochaines recherches en cours ?

La prochaine étape, actuellement en cours se focalise sur la généralisation de ce type d’algorithme à des données issues d’autres cohortes ou récoltées avec d’autres appareils. Nous développons ainsi des méthodes permettant aux algorithmes de classification de stade de sommeil de mieux fonctionner sur des données très variables.

De plus, nous nous intéressons à la détection de motifs d’intérêt (patterns) dans l’EEG à partir de méthode de deep learning. Ce problème est plus complexe, car les motifs recherchés sont multiples, sont de durée variable et apparaissent à plusieurs instants au cours de la nuit. Toutefois, ce problème est également plus intéressant car il permet d’accéder à des informations plus précises sur la nuit d’un dormeur et sur le dormeur en lui même.

Et de ton côté, que comptes-tu faire après ta thèse ?

Je suis très sensible aux problématiques gravitant autour du sommeil. Je compte donc poursuivre dans ce domaine en me penchant davantage sur le côté industriel du machine learning. Cela me permettra d’aborder des questions plus médicales, comme la détection de certaines pathologies.

Merci Stanislas pour ces explications, les neurosciences nous apparaissent un peu moins obscures à présent !

Si l’interview de Stanilas vous a plu, nous vous invitons à décuvrir dès à présent la manière dont Dreem protège vos données en lisant l’interview d’Olivier Tranzer, Responsable du Pôle Technique !

Articles similaires

Rencontrez Olivier, Directeur Engineering & Software de Dreem

L'importance de l'équipe Dreem - rencontrez Olivier Tranzer !  Chez Dreem, nous avons constitué une équipe incroyable composée…

Dreem : découvrez notre Manifeste

“ Le droit et la liberté de contrôler sa propre conscience et ses processus de pensée électrochimique est le…

Rencontrez Kaveh, Responsable de la Conception Electronique du Matériel de Dreem

Dreem a la chance d’avoir de nombreux brillants employés. Nous sommes assidus et innovants. Surtout, nous apprenons constamment.…