Critères de l'offre
Métiers :
- Développeur Big Data (H/F)
Expérience min :
- débutant à 1 an
Secteur :
- Administration, Ressources humaines, Gestion, Conseil en gestion
Diplômes :
- Diplôme de grande école d'ingénieur
- + 2 diplômes
Compétences :
- Apache Hadoop
- Python
Lieux :
- Paris (75)
Conditions :
- Stage
- À partir de 8 190 €
- Temps Plein
L'entreprise : Autorité de la concurrence
Autorité administrative indépendante, l'Autorité de la concurrence veille au bon fonctionnement concurrentiel de l'économie en France. Elle contribue à la régulation de la concurrence aux niveaux européen et international. Sa compétence transversale la conduit à intervenir dans tous les secteurs économiques.
En savoir plus sur nos missions.
Figurant parmi les meilleures autorités de concurrence au monde dans le classement de la Global Competition Review, l'Autorité est également en pointe sur les nouvelles problématiques liées à l'économie numérique et au développement durable.
Les services d'instruction, dirigés par le rapporteur général, comptent environ cent rapporteurs permanents. Ils comprennent six services dédiés au traitement des dossiers contentieux, dont l'un est par ailleurs en charge des professions réglementées, ainsi que le service des concentrations, le service des investigations, le service économique et le service de l'économie numérique. Chaque service est dirigé par un chef de service et/ou un rapporteur général adjoint. A cela s'ajoute deux conseillers (clémence et europe et réseau développement durable) qui sont directement rattachés au rapporteur général.
Le service de l'économie numérique a quatre objectifs :
- Développer les nouveaux outils (méthodes d'investigation, outils techniques) permettant à l'Autorité d'appréhender efficacement l'économie des plateformes ;
- Renforcer l'expertise numérique au sein de l'Autorité en intervenant soit seul soit en coopération avec les autres services dans les dossiers à forte composante numérique, qu'il s'agisse de concentrations d'entreprises ou d'investigations portant sur le respect du droit de la concurrence ;
- Agir en étroite coopération avec les autres autorités de concurrence, au niveau européen et international, les autorités de régulation, et les services de l'Etat compétents;
- Contribuer aux actions de communication de l'Autorité sur les sujets numériques et développer les contacts avec le monde académique et les institutions de recherche spécialisées dans le numérique.
Dans ce cadre, le service de l'économie numérique, en partenariat avec le « Computational Antitrust » de CodeX » [1], a développé en 2023 le premier outil interactif capable d'identifier, au sein des publications de l'Autorité (correspondant à l'ensemble des décisions, avis et mesures conservatoires publiés entre 2009 et 2021), les références à ses autres publications et de représenter ces interconnexions dans un graph.
[1] https://law.stanford.edu/wp-content/uploads/2023/01/3-Stanford-Computational-Antitrust-1.pdf
Description du poste
Le SEN propose un stage en Data-science sur l'année 2026, avec une spécialisation en IA générative et en traitement du langage naturel (NLP). Ce stage d'une durée comprise entre quatre et six mois, peut débuter entre juin et septembre.
En cherchant à valoriser les données publiques de l'Autorité[1], le SEN développe des solutions innovantes faisant appel à la datascience et à l'IA générative : moteur de recherche spécialisé, prototype de Retrieval augmented Generation (RAG), agent conversationnel, chaine d'agents, etc.
Accompagné, les missions du stagiaire expert en science des données seront les suivantes :
-
Améliorer le prototype de RAG et le faire évoluer en optimisant le processus de création des chunks ainsi que la détection des informations pertinentes dans les publications.
-
Effectuer une revue de la littérature et de la veille sur les méthodologies innovantes développées par le monde académique.
-
Implémenter et tester ces approches algorithmiques innovantes (i.e. mise en place d'une veille automatique et intelligente, etc.).
-
Identifier et ajouter de nouvelles sources de données pertinentes, via notamment le protocole MCP.
-
Partager et documenter ces méthodes
Enfin, la personne sélectionnée pourra assister les data-scientists du SEN dans certaines de leurs missions, tel que de l'assistance dans des projets internes ou des coopérations académiques.
[1]https://www.data.gouv.fr/datasets/decisions-publiees-par-lautorite-de-la-concurrence-depuis-1988/
Description du profil
Étudiant(e) en quatrième ou cinquième année, ou ayant fini ses études, d'un cursus Bac+5 (2/3e année d'un cursus Ingénieur ou M1/M2) spécialisé en Data Science, le stagiaire en science des données devra disposer de bonnes connaissances en programmation (Python) et en statistiques. Il devra avoir une ou plusieurs expérience(s) avec des modèles d'IA générative et/ou des outils de traitement du langage naturel : LLM, bases de données vectorielles (Qdrant, transformers, huggingface, LLMs, ElasticSearch, …)
La connaissance ou l'appétence pour des outils de data visualisation (Streamlit, Dash, Gradio, …), seront appréciées.
La personne recherchée saura faire preuve d'autonomie, de sens de l'initiative. Pour autant, elle saura rendre compte régulièrement de l'évolution de son travail et démontrera de capacité d'adaptation aux différents projets. Elle disposera d'un excellent relationnel et de capacité de vulgarisation, ainsi qu'un goût prononcé pour le travail en mode collaboratif. Réactive et rigoureuse, elle témoignera d'une capacité à respecter les délais dans le traitement des affaires qui lui sont confiées.
Les candidatures (curriculum vitae et lettre de motivation) doivent être déposées au plus tard le 12 mars 2026 via notre site carrière - offre « stage - Expert(e) Science des données (datascientist) - Second semestre 2026 »

