Critères de l'offre
Métiers :
- Data scientist (H/F)
- + 2 métiers
Secteur :
- Transports, Logistique, Courrier
Diplômes :
- Brevet Professionnel BP, Brevet de Technicien BT
- + 2 diplômes
Compétences :
- Python
- Modélisation de données
- SQL
- Environnement unix
- Kubernetes
- + 1 compétence
Lieux :
- Nantes (44)
Conditions :
- Stage
L'entreprise : SNCF
Rejoignez un environnement stimulant et des équipes passionnées qui mettent leur talent et leur savoir faire au service des gares de demain. Plus de 3 700 collaborateurs, présents sur l'ensemble du territoire, contribuent en effet à repenser l'avenir des gares et à les intégrer au coeur des projets urbains. La force de SNCF Gares & Connexions, c'est d'intégrer une grande variété de profils et de faire travailler ensemble des métiers très différents.
Description du poste
Sous la responsabilité du Responsable Data, le Stagiaire Data Scientist sera intégré au pôle Data Studio de SNCF G&C composé de Data Engineer, Data Scientist, Data Analyst, Data Manager. Il sera amené à intervenir sur toute la chaîne de valeur de la donnée : collecte, traitements, restitution, gouvernance.
En tant que Data Scientist, ses missions principales seront les suivantes :
Comprendre les enjeux stratégiques et opérationnels des métiers de la SA.
Identifier, collecter, explorer et préparer les données pertinentes issues de sources variées et complexes.
Concevoir, entraîner, évaluer et déployer des modèles statistiques et de machine learning (IA Gen, prédiction, classification, détection d'anomalies, segmentation, etc.).
Produire des analyses exploratoires approfondies, permettant d'identifier des tendances, corrélations ou comportements clés.
Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer
Développer des notebooks analytiques, scripts ou API permettant la mise à disposition des résultats.
Produire des visualisations et rapports d'interprétation des modèles pour faciliter la compréhension et la prise de décision des métiers.
Documenter les approches, les modèles, les choix méthodologiques et les résultats.
Durant son stage, il sera également amené à travailler sur des sujets de Data Visualisation pour répondre à des sujets transverses à l'équipe Data. A ce titre, il sera amené à :
Comprendre les besoins métier en participant à des ateliers de cadrage
Concevoir, modéliser et maintenir des modèles de données adaptés aux besoins
Développer et maintenir des pipelines de transformation assurant la fiabilité et la performance des flux de données
Produire des analyses et visualisations claires permettant aux équipes métiers de prendre des décisions éclairées
Industrialiser les modèles développés en collaboration avec l'équipe Infra et les Data Engineer
Description du profil
BAC + 5 - Spécialité Data Science, Intelligence artificielle, Statistiques appliquées :
Compétences en statistique appliquée, machine learning, deep learning
Compétences en traitement et intégration de données (ETL/ELT, data pipelines), et déploiement de modèles (Azure ML, API, Docker)
Maîtrise du langage Python, et notamment des principales bibliothèques data science (pandas, scikit-learn, numpy, matplotlib, seaborn, etc.)
Maîtrise des concepts de modélisation de données et des outils de transformation (SQL, dbt, etc.)
Connaissance des outils de visualisation (Power BI, Tableau, Looker...).
Connaissance des environnements cloud (Azure, Databricks, Azure ML).
Connaissance des bonnes pratiques de documentation, d'évaluation et de traçabilité des modèles
Familiarité avec les méthodes agiles et les environnements collaboratifs.

