Développement et Implémentation de Méthodologies de Versioning pour le Management des Données Issues de Procédés Chimiques
Direction Expérimentation Procédés
Stage
Entre février et août 2025
6 mois
Auvergne et Rhône-Alpes
Oui
IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. De la recherche à l’industrie, l’innovation technologique est au cœur de son action, articulée autour de quatre priorités stratégiques : Mobilité Durable, Energies Nouvelles, Climat / Environnement / Economie circulaire et Hydrocarbures Responsables.
Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur :
- l’apport de solutions aux défis sociétaux de l’énergie et du climat, en favorisant la transition vers une mobilité durable et l’émergence d’un mix énergétique plus diversifié ;
- la création de richesse et d’emplois, en soutenant l’activité économique française et européenne et la compétitivité des filières industrielles associées.
Partie intégrante d’IFPEN, l’école d’ingénieurs IFP School prépare les générations futures à relever ces défis.
Développement et Implémentation de Méthodologies de Versioning pour le Management des Données Issues de Procédés Chimiques
Dans les environnements industriels d’aujourd’hui, axés sur les données, garantir des données de haute qualité est indispensable pour optimiser la prise de décision, l'optimisation des procédés et l'innovation. À mesure que de plus en plus d’organisations adoptent des méthodologies centrées sur les données, garantir l'intégrité, la cohérence et la traçabilité des données devient essentiel. Un aspect clé de ce défi est le versionnage des données, c’est-à-dire le processus de suivi des modifications apportées aux ensembles de données au fil du temps.
IFPEN s’emploie à devenir un acteur clé de la transition énergétique, écologique et numérique en proposant des solutions technologiques innovantes aux défis industriels et sociétaux liés à l’énergie et au climat. Le développement de telles solutions passe par des tests expérimentaux avec des outils expérimentaux spécifiques (unités pilotes), pour produire des données destinées aux modèles mathématiques et permettant de concevoir, dimensionner et optimiser les procédés.
La majorité des données générées, des séries temporelles principalement, nécessitent des techniques efficaces de profilage, de validation et de nettoyage des données pour éviter les erreurs susceptibles d'affecter les analyses et décisions futures. La définition d’un indicateur ou d’une méthode de versionnage définie de ces modifications permettrait un gain en qualité, en performances et en compréhension de nos données.
L’objectif de ce stage est d’explorer, de comparer et d’implémenter des techniques de versionnage des données qui répondront aux besoins spécifiques d’IFPEN. Cela contribuera à renforcer la confiance dans les données, en particulier lorsqu'elles sont utilisées pour des décisions critiques et les efforts de R&D.
Objectifs du stage :
- Comprendre le rôle du versioning des données dans le cadre plus large de la gestion de la qualité des données.
- Comparer différentes approches de versioning vis à vis de leur performance et adaptabilité.
- Implémenter et généraliser les algorithmes de versionning les plus efficaces par rapport aux cas d’étude IFPEN.
- Développer les meilleures méthodologies pour la gestion des versions et contribuer à l’établissement de processus de gestion des données transparents et fiables.
Tâches de l’étudiant :
- Familiarisation avec les données et les problématiques de l’entreprise en lien avec le cas d’étude choisi.
- Réaliser une étude bibliographique sur les techniques de management des données.
- Implémenter et comparer différents algorithmes de versioning pertinents.
- Généraliser les approches les plus performantes et les valider sur un nouveau cas d’étude.
Ce stage offrira au candidat une expérience pratique dans la résolution de défis concrets liés à la gestion des versions de données dans un environnement de recherche et développement, lui permettant de contribuer directement à l'amélioration des pratiques de gestion des données et d'assurer une meilleure qualité des données pour les projets futurs à l'IFPEN.
Le stage pourra déboucher sur une thèse qui aura pour but de définir des critères de qualité des données et d’étudier le lien entre la qualité de données interdépendantes, ainsi que l’amélioration de la qualité des données.
Profil recherché :
Master 2 ou dernière année d’école d’ingénieur, spécialisé en sciences informatiques, sciences des données.
Un profil génie chimique ou chimie avec de solides compétences en informatique pourrait également être adapté au sujet.
- Des connaissances en machine-learning seraient un plus.
- Langue Française ou Anglaise, curiosité, enthousiasme, autonomie.