Modèle d'IA générative de type diffusion probabiliste pour générer des cartes de susceptibilité aux glissements de terrain
Direction Sciences et Technologies du Numerique
Stage
Entre mars et juin 2025
5 mois
Ile de France
Oui
IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. Depuis les concepts scientifiques en recherche fondamentale jusqu’aux solutions technologiques en recherche appliquée, l’innovation est au cœur de son action, articulée autour de quatre orientations stratégiques : climat, environnement et économie circulaire ; énergies renouvelables ; mobilité durable ; hydrocarbures responsables.
Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur l’apport de solutions aux défis sociétaux et industriels de l’énergie et du climat, au service de la transition écologique. Partie intégrante d’IFPEN, IFP School, son école d’ingénieurs, prépare les générations futures à relever ces défis.
Modèle d’IA générative de type diffusion probabiliste pour générer des cartes de susceptibilité aux glissements de terrain
Les glissements de terrain sont parmi les désastres naturels les plus dévastateurs au monde. Ils peuvent entraîner de graves conséquences telles que des décès, des blessures importantes et des dommages étendus aux biens et aux infrastructures, avec un coût estimé de plusieurs milliards de dollars.
Le déclenchement de glissements de terrain dépend de multiples facteurs, tels que de fortes précipitations, des tremblements de terre, des événements volcaniques, la pente du terrain, la couverture végétale, les propriétés du sol et les activités humaines (routes, bâtiments, pratiques agricoles),...
C’est pourquoi établir une carte représentant la susceptibilité aux glissements de terrain (LSM -Landslide Susceptibility Map) i.e. la probabilité d'occurrence d'un glissement de terrain dans un espace géographique donné, est un outil crucial dans la prédiction de ces désastres pour minimiser leurs impacts. La multiplicité des facteurs et la complexité de leur relation aux déclenchement effectif des glissements de terrain rendent la génération de LSM précis et fiables une tâche difficile. Ces dernières années, le développement rapide de l'apprentissage profond a considérablement facilité le domaine des LSM.
Ce stage investiguera une approche basée sur des modèles d’IA générative et notamment sur des modèles de diffusion probabiliste[1] pour générer ces cartes de susceptibilité. En effet, ces méthodes permettent de gérer la complexité en capturant par leur architecture les interactions complexes entre de multiples facteurs. La prise en compte des incertitudes est native du fait de la nature probabiliste des modèles utilisés et enfin, une fois qu’ils ont appris, ils peuvent efficacement échantillonner une large gamme de scénarios et donc permettre d’obtenir ainsi les cartes de susceptibilités.
Nous poserons le cas d’usage en Italie et plus particulièrement dans le domaine alpin ou dans les Apennins.
Objectif
Durant son stage, l’étudiant devra :
(1) Collecter et préparer le dataset: La première étape consiste à collecter des données sur les glissements de terrain leur localisation, extension et leur date :
- Des catalogues de glissements de terrain en Italie (ITALICA ou Franeitalia) sont disponibles en ligne
Et les facteurs de contrôle potentiels tels que :
- Les précipitations voire la saturation des sols,
- Le modèle numérique de terrain (MNT) décrivant l’altitude de la topographie. les pentes, courbures, réseaux hydrographiques pourront être calculées depuis le MNT.
- La géologie pour décrire les types de sol et la stabilité des pentes,
Des données environnementales ou anthropiques telles que la couverture végétale ou l’usage des sols, les routes etc.
Si possible des informations temporelles sur les glissements de terrain passés ou les précipitation
(2) Définir une architecture de « modèle de diffusion probabiliste »
La définition du modèle se fera en 3 temps :
- Entraînement du Modèle : Entraîner le modèle choisi sur les données prétraitées pour qu'il apprenne la relation complexe entre les différents facteurs et les occurrences de glissements de terrain.
- Génération de Scénarios : Utiliser le modèle pour générer de multiples scénarios possibles de conditions environnementales et géologiques, en tenant compte des incertitudes et des variabilités inhérentes aux données.
- Évaluation de la Susceptibilité : Pour chaque scénario généré, évaluer la susceptibilité aux glissements de terrain.
(3) Valider et Calibrer le modèle : Il est essentiel de valider les prédictions du modèle en les comparant avec des données historiques de glissements de terrain. Les modèles peuvent être calibrés en ajustant leurs paramètres pour améliorer la précision des prédictions.
Dans l’ensemble de ces tâches, l’étudiant portera un soin particulier :
- Au développement et à l’usage d’API propres pour la collecte et le stockage des données.
- A la définition d’une réalité terrain basée sur les données collectées et calculées
A des métriques pour mesurer la qualité des scénarios notamment par rapport à des données éparses.
Mots-clés
IA générative, modèle de diffusion probabiliste, glissements de terrain, « Landslide Susceptibility Map »
Profil recherché
Élève Master 2 ou Ingénieur en 3ème année d'école, option informatique, analyse de données ou mathématiques appliquées, intéressé par le développement informatique dans le domaine de l’analyse de données, du machine learning et de l’intelligence artificielle.
- Élève ayant une connaissance de l’environnement de programmation de type python/pytorch/gpu