Critères de l'offre
L'entreprise : BRGM
Rejoindre le Bureau de Recherches Géologiques et Minières (BRGM), c'est intégrer l'établissement public de référence dans les sciences de la Terre rassemblant 1 000 personnes expertes et passionnées, réparties dans 29 entités implantées en France métropolitaine et d'outre-Mer.
L'activité du BRGM a pour objectif la connaissance géologique et la compréhension des phénomènes liés au sol et au sous-sol, avec un enjeu: répondre aux défis des changements environnementaux à travers des projets innovants, à enjeux sociétaux.
L'activité du BRGM a pour objectif la connaissance géologique et la compréhension des phénomènes liés au sol et au sous-sol, avec un enjeu: répondre aux défis des changements environnementaux à travers des projets innovants, à enjeux sociétaux.
Description du poste
L'objectif de ce stage est d'étudier une méthode d'apprentissage automatique semi-supervisée pour prédire des données de forage. Cette méthode est inspirée de méthode de recommandation par apprentissage de similarité [1,2].
Dans le cas des données de forage, il s'agira d'utiliser une approche basée sur les K plus proches voisins (KNN), où le voisinage est constitué par des forages existants. Un point clé est donc la définition d'une similarité entre forages, qui sera apprise à partir des caractéristiques des forages.
La méthode envisagée repose sur les étapes suivantes :
1.Extraction de caractéristiques pertinentes des forages existants ;
2.Définition de similarités simples propres à chaque caractéristique ;
3.Constitution d'un ensemble d'apprentissage par labellisation faible [3] ;
4.Entrainement d'un classifier linéaire permettant de pondérer les similarités entre caractéristiques [1] ;
5.Définition des paramètres du KNN ;
6.Définition de la méthode de prédiction à partir des forages voisins.
L'approche sera comparée aux méthodes de l'état de l'art pour prédire les données de forage, notamment le Krigeage (https://fr.wikipedia.org/wiki/Krigeage).
Le déroulement du stage comprendra :
-Une étude bibliographique ;
-La proposition d'une approche de prédiction de données de forage ;
-L'implémentation et le test de l'approche proposée.
[1]Ramanathan V. Guha, Vineet Gupta, Vivek Raghunathan, Ramakrishnan Srikant: User Modeling for a Personal Assistant. WSDM 2015: 275-284.
[2]Krista Drushku, Julien Aligon, Nicolas Labroche, Patrick Marcel, Verónika Peralta: Interest- based recommendations for business intelligence users. Inf. Syst. 86: 79-93 (2019).
[3]Alexander Ratner, Stephen H. Bach, Henry R. Ehrenberg, Jason A. Fries, Sen Wu, Christopher Ré: Snorkel: rapid training data creation with weak supervision. VLDB J. 29(2-3): 709-730 (2020).
Dans le cas des données de forage, il s'agira d'utiliser une approche basée sur les K plus proches voisins (KNN), où le voisinage est constitué par des forages existants. Un point clé est donc la définition d'une similarité entre forages, qui sera apprise à partir des caractéristiques des forages.
La méthode envisagée repose sur les étapes suivantes :
1.Extraction de caractéristiques pertinentes des forages existants ;
2.Définition de similarités simples propres à chaque caractéristique ;
3.Constitution d'un ensemble d'apprentissage par labellisation faible [3] ;
4.Entrainement d'un classifier linéaire permettant de pondérer les similarités entre caractéristiques [1] ;
5.Définition des paramètres du KNN ;
6.Définition de la méthode de prédiction à partir des forages voisins.
L'approche sera comparée aux méthodes de l'état de l'art pour prédire les données de forage, notamment le Krigeage (https://fr.wikipedia.org/wiki/Krigeage).
Le déroulement du stage comprendra :
-Une étude bibliographique ;
-La proposition d'une approche de prédiction de données de forage ;
-L'implémentation et le test de l'approche proposée.
[1]Ramanathan V. Guha, Vineet Gupta, Vivek Raghunathan, Ramakrishnan Srikant: User Modeling for a Personal Assistant. WSDM 2015: 275-284.
[2]Krista Drushku, Julien Aligon, Nicolas Labroche, Patrick Marcel, Verónika Peralta: Interest- based recommendations for business intelligence users. Inf. Syst. 86: 79-93 (2019).
[3]Alexander Ratner, Stephen H. Bach, Henry R. Ehrenberg, Jason A. Fries, Sen Wu, Christopher Ré: Snorkel: rapid training data creation with weak supervision. VLDB J. 29(2-3): 709-730 (2020).
Description du profil
Stage en fin d'études : Master 2 ou ingénieurNiveau d'études requis : Bac +5
Durée du stage : 6 mois
Période de stage : avril-septembre.
Le poste est à pourvoir à partir du mois d'avril 2025.
Le stage sera encadré par Christelle LOISELET (BRGM) et Patrick MARCEL (Université d'Orléans) et se déroulera au LIFO, campus Universitaire de La Source à Orléans.
Nous recherchons un(e) étudiant(e) ayant des connaissances solides en géologie, programmation, et mathématiques, et une appétence pour la recherche.
Le stage pourra déboucher sur une thèse de doctorat financée.
Salaire et avantages
Salaire : Salaire selon profil
Référence : 2024-2635