Stage Développement d'une bibliothèque de modèles génériques d'évaluation des canalisations
Critères de l'offre
Description du poste
Le stage est proposé par Optimatics, éditeur du logiciel d'optimisation des investissements pour les réseaux et le LyRE, Centre d'Innovation et d'Expertise de SUEZ.
Optimatics appartient à la filiale de Suez 'Digital Solutions', éditeurs de logiciels d'aide à la décision pour les services à l'environnement. Optimatics est composé d'une cinquantaine de personnes répartis aux USA (Chicago), Australie (Adélaïde), en UK et en France et développe un outil d'optimisation de gestion patrimoniale AssetAdvancedTM.
Le LyRE est composé d'une cinquantaine d'ingénieurs et chercheurs, répartis en 5 pôles d'expertises : Data, Réseaux, Environnement, Recyclage & Valorisation des déchets et Acteurs & Usages.
Le pôle Réseaux intervient sur les domaines des réseaux d'assainissement et des stations de pompage. Composé d'une équipe de 18 personnes, les activités du pôle Réseaux s'articulent autour de 3 grandes thématiques dont l'une d'entre elles porte sur la Gestion patrimoniale. Le pôle Data a pour mission de valoriser les données dans un objectif d'optimisation des performances métiers. Composé d'une équipe de 12 personnes, le pôle Data porte une expertise en data science.
Contexte
Dans le cadre d'une étude R&D qui s'intègrera dans une solution d'aide à la décision pour la gestion patrimoniale des réseaux de collecte, SUEZ LyRE souhaite capitaliser sur l'expérience du groupe SUEZ de gestion +65 000 km de réseau de collecte en France par la compilation d'une base de données d'état des canalisations enterrées de collecte (assainissement et pluvial) dont la gestion lui est confiée.
Cette base de données constituera une bibliothèque riche d'informations à valoriser par l'établissement de modèles stochastiques ou d'IA de l'état des collecteurs d'assainissement pour prédire, donc anticiper, leur état de dégradation ou d'étanchéité (générateurs d'impact environnementaux, financiers, voire humains). Les résultats de ces modélisations permettront à terme de contribuer à la planification des opérations de diagnostic et de définition des investissements de renouvellement nécessaires au maintien des infrastructures. Une fois le projet finalisé et les algorithmes industrialisés, il constituera une brique du logiciel AssetAdvancedTM qui permettra de proposer des modèles d'état de collecteurs « génériques » pour les collectivités dont les données d'inspection ou descriptives du réseau sont peu ou mal qualifiées.
Objectif
L'objectif de ce stage est de construire une base de données structurée centralisant les informations de diagnostic des réseaux d'assainissement et d'amorcer la valorisation de ces données par le développement de modèles génériques de prédiction de l'état des collecteurs.
Pour ce faire, la mission nécessitera de :
• Réaliser un état des lieux des sources de données disponibles (inspections, réseaux, open data), de leur volumétrie, des méthodes d'interprétation des inspections disponibles et un état de l'art des modèles et algorithmes internes de clustering et d'évaluation de l'état des réseaux.
• Construire une base de données par la récupération des informations descriptives des canalisations inspectées (résultats d'inspections, descriptifs réseaux). Les résultats d'inspections pourront prendre différentes formes (rapport pdf, fichier texte, issus de la base SIG de SUEZ Eau France). Ils nécessiteront, dans certains cas, d'être analysés par la mise en place d'une méthode automatisée d'interprétation de leurs données. Les données publiques disponibles seront également collectées afin d'enrichir cette base de données.
•Constituer des classes de canalisations homogènes (par des méthodes de classifications statistiques) d'après leurs caractéristiques mais aussi de leur contexte environnemental.
•Mettre en place et valider de modèles génériques orientés données (statistique ou machine learning) permettant la prédiction de l'état des collecteurs par classe à partir de cette base d'apprentissage en cherchant des relations dans la structure de ces données.
Description du profil
- 2ème année de Master ou dernière année d'école d'ingénieur en statistiques, modélisation, data science
- Maitriser un langage de programmation, R ou Python permettant les traitements et modélisations avancés de données.
- Solides connaissances en base de données, analyse de données et bonnes bases en modélisation statistique et machine learning.
- Une connaissance et première pratique des outils cartographiques sera appréciée.
- capacité à apprendre et à partager son savoir-faire, organisation, rigueur et autonomie ; capacité d'analyse ; sensibilité au développement durable et notamment aux enjeux liés à l'eau ; anglais courant.
Référence : req47103