Vers un standard commun de la data média en France

Audience le mag
Toujours mieux connaître son public est indispensable aujourd’hui pour les médias

Editeurs internet, chaînes de télévision, de radio disposent avec le digital de volumes vertigineux de données. Comment exploiter ces données ? Comment les analyser ? Les enrichir ? Ces réflexions sont au cœur des stratégies médias pour l’optimisation des revenus publicitaires dans un contexte de concurrence accrue et de poids croissant du programmatique (63% du marché publicitaire digital[1] ). Depuis fin 2016, Médiamétrie – en tant que tiers de confiance - développe de nouveaux services Data pour accompagner les projets des éditeurs, régies et opérateurs en créant les conditions d’un standard commun de la data media en France.

Avec le développement des mesures digitales, Médiamétrie traite déjà depuis plusieurs années des données massives, les fameuses « Big Data ». Des volumes qui n’ont cessé de croître avec les évolutions des pratiques et la multiplication des écrans. Aujourd’hui, Médiamétrie traite plus d’1 milliard de données chaque jour. Des données qu’elle croise avec ses données de panel de mesure d’audience, pour obtenir des résultats encore plus riches et précis. Cela s’appelle l’hybridation des mesures, une expertise développée à Médiamétrie depuis 2010 grâce à son pool de data scientists. En 2016, Médiamétrie a également constitué un Data Lake, « réservoir de données » permettant à ses équipes d’avoir accès de manière optimale à l’ensemble des résultats d’audience qui y sont chargés, pour réaliser des analyses et des activités de R&D.

Forte de ces expériences et outils, Médiamétrie a pris l’initiative en 2016 de lancer un travail de création d’un standard commun de la data média en France. L’objectif étant de faciliter son utilisation et de renforcer la confiance et la valeur de la data sur le marché publicitaire. En qualité de tiers de référence, Médiamétrie se donne pour objectif de répondre aux attentes des médias, régies, agences et annonceurs sur la data en termes de qualité, d’homogénéité des méthodes, de neutralité et de transparence.

Un comité Data a ainsi été créé par Médiamétrie en juillet 2017 pour travailler sur ce projet. Il réunit médias, pure players, agences, annonceurs et opérateurs télécom, soit 21 membres (voir encadré), parmi les principaux acteurs de la donnée en France.

Qualifier et valider les données

Les premières étapes de cette démarche consistent à développer des outils pour qualifier les datas collectées par les éditeurs médias. L’équipe Data Science de Médiamétrie a conçu un modèle prédictif de données socio-démographiques : il qualifie les cookies des éditeurs grâce aux données du panel Internet de Médiamétrie, sur la base d’un apprentissage statistique (machine learning). Ainsi, les éditeurs peuvent connaître le profil socio-démographique des cookies, à partir des comportements de navigation web. Les données cookies de navigation - 10 millions d’octets - sont stockées dans le Data Lake de Médiamétrie.

Autre exemple très innovant sur la vidéo et unique en France : la qualification de données IPTV de visionnage de programmes en catch-up TV obtenues à partir de box opérateurs. Pour chaque identifiant issu d’une box, le modèle renseigne sur le profil des spectateurs des programmes de télévision visionnés en replay sur l’écran de TV - genre, âge et présence d’enfants dans le foyer - en s’appuyant sur le panel Médiamat, la mesure d’audience de la télévision en France.

Une des possibilités offertes par ces modèles est également d’enrichir la donnée média issue de Médiamétrie par de la donnée externe non-media, comme des intentions d’achat par exemple.

Estelle Duval, Directeur Data Business de Médiamétrie souligne : « En identifiant un profil socio-démographique, Médiamétrie apporte une plus grande précision à la donnée d’usage issue de cookies et de logs IPTV pour mieux cibler les campagnes publicitaires digitales et obtenir des impressions supplémentaires. »

Médiamétrie a également développé une méthode qui permet de valider par un tiers de confiance les informations des bases de données des éditeurs, opérateurs et annonceurs. Cette méthode consiste à croiser ces bases de données avec les informations recueillies par Médiamétrie dans le cadre de ses études : composition du foyer, données socio-démographiques. Ces données constituent la nouvelle base à partir de laquelle sera défini un indice de qualité des données au global et par critère socio-démographique.

Image

Fédérer le marché

Dans la continuité de ces démarches de qualification de données, Médiamétrie propose de fédérer les données d’un ensemble d’éditeurs médias et opérateurs afin d’enrichir les outils de planning et de bilans de campagne. Mises en commun, validées et homogénéisées, ces données seront ainsi extrêmement riches et complètes, ce qui représente une force dans un contexte digital dominé par les GAFA. Cet important volume de données sera hébergé et organisé dans le Data Lake de Médiamétrie.

Cette plateforme pose une question prioritaire, à savoir l’adoption par le marché d’un Identifiant Unique, qui permettra de calculer couvertures et répétitions avec la data. Médiamétrie - à travers ses équipes SI - conduit sa propre R&D sur le sujet.

« A l’image de ce que nous sommes dans le domaine de l’audience, nous souhaitons que Médiamétrie favorise l’émergence d’une référence commune de la Data Média en France, un tiers de confiance neutre et indépendant. Notre objectif est d’aider les éditeurs à valoriser leurs offres en nous appuyant sur notre expertise et nos savoir- faire méthodologiques et technologiques », conclut Benoît Cassaigne, Directeur Exécutif de Médiamétrie.

Laure Osmanian Molinero


Le comité Data de Médiamétrie :
 
366, ACPM, Canal +, Dentsu Aegis Network, France Télévisions, GroupM, Groupe Figaro / CCM Benchmark, Groupe Les Echos, Havas Média, Lagardère Active Digital, La Poste, Leboncoin, Le Monde, M6, Omnicom Media Group, Orange, Prisma Media, Publicis Media, SFR, TF1, Union des Annonceurs.


 

Calcul d’intervalle de confiance à 95%

Taille de l'échantillon ou d'une cible dans l'échantillon

n =

Proportion observée dans l'échantillon ou sur une cible dans l'échantillon

p =

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

Test de significativité des écarts entre deux proportions

Permet d'évaluer si la différence entre 2 proportions est significative au seuil de 95%

Proportion

Taille de l'échantillon

Échantillon 1

%

Échantillon 2

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

En complément
×
Dictionnaire
Les mots
des médias
Nouvelle
édition
+500
définitions
A
B
C
D
E
F
G
H
I