Stage - Assistant Data Scientist (F/H)
Leader des études médias, **Médiamétrie** observe, mesure et analyse les comportements du public et les tendances du marché. Face à l’évolution rapide des usages numériques et des nouveaux modes de consommation des médias, Médiamétrie fait évoluer en permanence ses dispositifs de mesure d’audience.
**Contexte du stage**
La **Direction Data Science (DDS)** met en œuvre des approches d’apprentissage statistique pour enrichir les dispositifs de mesure et d’analyse d’audience.
Dans ce cadre, le pôle **DDS Mesures Automatiques** explore l’usage de **méthodes de génération de données synthétiques** pour compléter les données issues des panels TV et Radio, tout en maîtrisant les coûts et en garantissant la représentativité des mesures.
L’objectif du stage est de **concevoir un prototype fonctionnel** permettant de générer des données de visionnage et d’écoute synthétiques, cohérentes avec les distributions observées dans les panels, selon plusieurs critères : **socio-démographiques, thématiques de chaînes et stations et temporalité**.
Vous évoluerez dans un environnement stimulant au sein d’une direction en pleine évolution autour des enjeux IA et mesure d’audience.
**Missions principales**
Encadré(e) par un Data Scientist expérimenté, vous interviendrez sur l’ensemble des étapes du projet :
* Compréhension du fonctionnement et des spécificités des mesures d’audience TV et radio ;
* Analyse exploratoire et préparation des données panélistes ;
* Revue et comparaison des approches existantes de génération de données synthétiques ;
* Conception, développement et test d’un **prototype de génération** d’individus et de leurs audiences ;
* Évaluation statistique de la cohérence et de la robustesse des résultats ;
* Présentation et vulgarisation des conclusions au sein de la Direction Data Science.
* Étudiant(e) en dernière année d’école d’ingénieurs ou de master en **Statistiques / Data Science / Mathématiques appliquées** ;
* Bonnes connaissances en **statistiques** et en **traitement de données** ;
* Maîtrise de base de **Python** (pandas, scikit-learn, numpy) et intérêt pour les **outils open source** ;
* Curiosité pour les problématiques de mesure d’audience et pour les applications concrètes de la data science ;
* Esprit d’analyse, rigueur méthodologique et capacité à présenter des résultats de manière claire et structurée.