Détection Non-Supervisée d'Anomalies dans des Flux Continus de Séries Temporelles Multivariées H/F

Les missions du poste

Le groupe EDF est l'un des premiers électriciens mondiaux, à la pointe de l'innovation technologique. EDF s'engage pour un avenir énergétique juste, innovant et durable. C'est à nous, femmes et hommes d'EDF, fiers de nos missions de service public, de transformer demain.
Dans le contexte du suivi en continu des matériels des installations de production d'électricité d'EDF, la détection d'anomalies en temps réel dans les séries temporelles issues des capteurs de surveillance représente un enjeu crucial : plus elle est précoce et efficace, plus on est en mesure de réagir tôt et à bon escient pour tenter d'atténuer les impacts, voire d'éviter la survenue, de tout événement potentiellement critique, comme un dysfonctionnement ou une défaillance d'un équipement.

Disposer de méthodes performantes de détection non-supervisée de sous-séquences anormales en streaming, adaptées à des flux continus de séries temporelles multivariées (l'anomalie pouvant être caractérisée par l'évolution simultanée de plusieurs paramètres physiques, ou observée uniquement au travers des mesures conjointes de différents capteurs), revêt donc un intérêt de tout premier ordre pour aider à la décision en appui à l'exploitation et à la maintenance des matériels.
Les verrous scientifiques et techniques associés à cet objectif sont multiples, parmi lesquels la gestion de l'hétérogénéité entre les dimensions d'une même série temporelle multivariée (longueurs ou fréquences d'échantillonnage différentes, séries de données discrètes vs. continues, présence ou absence de corrélations entre plusieurs dimensions), le développement de mesures de similarité adaptées à des sous-séquences temporelles multivariées, la définition de mesures de performance adaptées à la détection de sous-séquences anormales, la construction d'un recueil de jeux de données appropriés pour que les résultats des études comparatives aient du sens, le choix de la famille d'algorithmes la plus adaptée pour répondre au problème et la calibration optimale du paramétrage, en visant un compromis entre « précision » / « adaptativité » / « robustesse à une dérive conceptuelle » / « temps d'exécution » / « taille mémoire » imposé par le cadre non-supervisé et en flux continu de données. La dimension « interprétabilité » du modèle est également importante.

Dans ce contexte, la thèse visera à produire des algorithmes génériques, performants et testés avec succès sur des jeux de données simulées, issues de la littérature et réelles provenant de cas d'usage EDF. Elle mènera à la production d'articles scientifiques (communications en conférences, articles de journaux) et dépôts de brevets, si pertinent. Les méthodes développées feront l'objet d'implémentations informatiques (librairies Python / R / Julia) pour faciliter leur utilisation en interne EDF R&D et leur transfert à l'ingénierie d'EDF.
Elle sera dirigée par deux chercheurs de l'équipe Valda d'Inria Paris et encadrée par trois chercheurs du département PRISME d'EDF R&D (site Lab Chatou).
Master 2, ou niveau équivalent, avec une dominante en Mathématiques Appliquées, Algorithmique, Machine Learning, ou Data Science.
Goût prononcé pour le développement informatique et l'algorithmique.
De bonnes qualités de communication et de rédaction sont indispensables pour le poste.
Maîtrise de la langue anglaise (écrite et parlée).

Le profil recherché

Master 2, ou niveau équivalent, avec une dominante en Mathématiques Appliquées, Algorithmique, Machine Learning, ou Data Science.
Goût prononcé pour le développement informatique et l'algorithmique.
De bonnes qualités de communication et de rédaction sont indispensables pour le poste.
Maîtrise de la langue anglaise (écrite et parlée).

Lieu : Chatou
Contrat : CDD
Accueil / Emploi / Emploi Chatou / Emploi