Étude de la robustesse à l'échantillonnage de modèles d'apprentissage : application à la prédiction de séries temporelles sur des données procédés.
Expérimentation Procédés


Type de contrat
Stage
Début
Entre décembre 2021 et janvier 2022
Durée
3 mois
Région
Auvergne et Rhône-Alpes
Indemn / Rém
Oui

ref R153-2021-4

IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. De la recherche à l’industrie, l’innovation technologique est au cœur de son action, articulée autour de quatre priorités stratégiques : Mobilité Durable, Energies Nouvelles, Climat / Environnement / Economie circulaire et Hydrocarbures Responsables.

Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur :

  • l’apport de solutions aux défis sociétaux de l’énergie et du climat, en favorisant la transition vers une mobilité durable et l’émergence d’un mix énergétique plus diversifié ;
  • la création de richesse et d’emplois, en soutenant l’activité économique française et européenne et la compétitivité des filières industrielles associées.

Partie intégrante d’IFPEN, l’école d’ingénieurs IFP School prépare les générations futures à relever ces défis.


Les Directions "Conception, Modélisation des Procédés" et "Expérimentation Procédés" visent à développer et améliorer les technologies pour le raffinage, le traitement du gaz, la conversion de la biomasse et la production d'énergie, optimiser le fonctionnement, la conception et la mise au point des équipements ainsi que l'exploitation des unités pilotes.
Les compétences scientifiques associées sont les études, l'optimisation et la simulation des procédés industriels, les unités pilotes, la génie chimique et hydrodynamique des réacteurs catalytiques, la génie thermique et la génie catalytique.

Étude de la robustesse à l’échantillonnage de modèles d’apprentissage : application à la prédiction de séries temporelles sur des données procédés.

Contexte du stage

Le génie des procédés est un domaine d'ingénierie, qui s’intéresse à l'application de la chimie physique dans l'industrie avec pour but principal de transformer de la matière. Il vise à concevoir et gérer le fonctionnement d'un procédé à différentes transformations chimiques et physiques. Ce domaine s’appuie sur l’analyse régulière de différents capteurs, paramètres et quantités physiques (température, pression, concentration, etc.), permettant d’optimiser les points de fonctionnement et la qualité des produits en fonction des matières sources.

Être capable de bâtir des modèles statistiques prédictifs ou explicatifs, liant les données mesurées ou calculées aux propriétés souhaitées, devient donc un enjeu important en termes d’efficacité des procédés. Depuis plusieurs années se développent des approches combinant connaissances métiers et méthodes de science des données pour améliorer la performance et la robustesse des modèles ; les défis sont nombreux : disponibilités des données, incertitudes, validité des modèles physiques, capacité des modèles off-line expérimentaux à fonctionner en conditions industrielles réelles on-line, etc.

Ce sujet s’intéresse essentiellement à ce dernier aspect. En effet, les données industrielles ne disposent bien souvent que de mesures acquises à une fréquence assez lente, sans maîtrise entière du moment exact de l’acquisition, tandis que les données expérimentales produites sur unités pilotes peuvent être obtenues toutes les minutes, avec une bonne précision temporelle.

Objectifs du stage

La ou le stagiaire sera affecté(e) au sein de la direction Expérimentation Procédés et travaillera en étroite collaboration avec la direction Sciences et Technologies du Numérique. La ou le stagiaire devra analyser les données sur un procédé identifié dans la continuité d’un stage de 2021 et devra étudier l’impact de l’échantillonnage sur la fiabilité et la robustesse de modèles d’imputation et de prédiction développés.

Le coeur du travail consistera en la mise en place d’un workflow permettant de réduire la fréquence d’acquisition initiale de données pilotes pour l’approcher des mesures industrielles et de mesurer précisément la perte d’efficacité et les incertitudes induites, et à adapter les modèles en conséquence. Il est également attendu de pouvoir donner des préconisations de « bon échantillonnage » en fonction des dépendances temporelles entre les différentes variables mesurées.

Profil recherché

Ce sujet étant à l’interface de deux domaines, il s’adresse soit à des étudiants M1 ou M2 en sciences du numérique ayant un sens physique développé ou à des étudiants M1 ou M2 en génie des procédés ayant une appétence pour le machine-learning et la programmation.