Apprentissage statistique sur données d’enquêtes pour qualifier des données massives

L'application aux données Web

Retrouvez la direction scientifique de Médiamétrie aux 11ème journée MAASC le 15 mai 2019 à Besançon. Aurélie Vanheuverzwyn, directrice scientifique, présentera les derniers travaux de Médiamétrie sur cette question

Résumé :
Un des principaux enjeux dans le domaine de la publicité est de délivrer la bonne annonce à la bonne personne. L’enjeu est d’autant plus important sur Internet que la publicité « adressée », c’est-à-dire ciblée et personnalisée en fonction du profil du visiteur, y est autorisée.
Dans ce contexte, un groupement d’éditeurs de sites Internet ont décidé de mutualiser leurs données afin d’améliorer leurs performances en matière de ciblage publicitaire et ont soumis la problématique à Médiamétrie.
On dispose donc des données exhaustives de connexion aux sites Web des éditeurs : chaque log de connexion contient l’identifiant du cookie, l’url visitée et la date et l’heure précise de la visite. Et l’enjeu est d’associer à ce cookie un profil socio-démographique (sexe, âge,…).
Médiamétrie dispose par ailleurs, pour la mesure d’audience Internet, d’un panel d’individus, dont le profil socio-démographique est connu, et dont les connexions à Internet sont intégralement mesurées. Il s’agit donc de construire, à partir de ces données d’enquêtes, un modèle de qualification socio-démographique des cookies visiteurs des sites en question.

L’objectif de la présentation est de détailler l’approche adoptée et les méthodes utilisées pour construire ce modèle de qualification.

Calcul d’intervalle de confiance à 95%

Taille de l'échantillon ou d'une cible dans l'échantillon

n =

Proportion observée dans l'échantillon ou sur une cible dans l'échantillon

p =

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

Test de significativité des écarts entre deux proportions

Permet d'évaluer si la différence entre 2 proportions est significative au seuil de 95%

Proportion

Taille de l'échantillon

Échantillon 1

%

Échantillon 2

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.