La data science au service de l’optimisation du ciblage publicitaire

Audience le mag

Croissance du visionnage de la télévision en replay, progression continue des usages sur internet et prédominance du mobile… Les éditeurs TV et Internet disposent désormais de volumes significatifs d’informations sur les usages de leurs utilisateurs, sans pour autant connaître leurs profils sociodémographiques. Pour en tirer le meilleur parti, Médiamétrie a développé un modèle innovant de qualification de données d’usage, fondé sur l’intelligence artificielle.

Optimiser le ciblage des campagnes publicitaires

Chaque jour, 7,8 millions de Français regardent la télévision en replay, soit 13% de plus en deux ans. Et cela pour une durée de 1h11 chacun. En 2019, 21 programmes de replay ont rassemblé plus d’1 million de téléspectateurs. On compte par ailleurs plus de 45 millions d’internautes quotidiens, dont 37 millions sur téléphone mobile ; cet équipement représente également plus de la moitié des 2 heures quotidiennes consacrées à naviguer sur internet.

Accompagnant la croissance de ces pratiques, les éditeurs TV et Internet orchestrent des campagnes publicitaires sur les plateformes de replay et les sites web et mobile, s’adressant à des cibles bien spécifiques selon le produit et les demandes des annonceurs. Estelle Duval, Directrice du département Data de Médiamétrie, relève : « pour améliorer les performances du ciblage de leurs campagnes publicitaires, les éditeurs ont besoin d’informations socio-démographiques associées aux usages de leurs utilisateurs. »

Les éditeurs Internet collectent de très importants volumes de données sur les usages et comportements des internautes visitant leurs sites grâce aux cookies qu’ils déposent à chaque visite. Cependant, à moins que leurs utilisateurs doivent s’identifier pour accéder aux contenus, les éditeurs ne savent pas qui ils sont. Côté télévision, lorsqu’un individu regarde un programme en replay sur un écran Internet, l’éditeur peut reconnaître son profil socio-démographique grâce aux informations reliées à son compte. Ce n’est pas le cas lorsqu’il le regarde sur téléviseur, via la box TV, où l’accès aux contenus ne passe pas par la création d’un compte, ce qui représente 2/3 des cas. De plus, le visionnage de programmes en replay sur le téléviseur est une pratique qui rassemble les membres du foyer, avec plus de 40% d’audience conjointe. Il est donc utile de connaître les profils des membres du foyer spectateurs des programmes en replay.

Un modèle prédictif fondé sur l’intelligence artificielle et le machine learning

Pour répondre à ces besoins des éditeurs et des annonceurs, Médiamétrie a développé le premier modèle prédictif basé sur l’Intelligence Artificielle via le machine learning. Cette méthodologie innovante qui permet d’optimiser le ciblage publicitaire - Data Profiling - permet aux éditeurs TV et Internet d’associer un profil socio-démographique à leurs données d’usage : la composition du foyer utilisateur des services de catch-up de l’éditeur TV depuis une box pour la TV, et l’âge et le sexe d’un cookie pour Internet. Tout cela dans le respect du Règlement Général sur la Protection des Données.

Estelle Duval précise : « Data Profiling est à la fois une innovation et une belle démonstration - grâce à la data science - de l’utilisation combinée des données de l’éditeur ne disposant pas toujours d’identification de ses utilisateurs, avec celle des panels d’audience de Médiamétrie, dont le profil sociodémographique est, lui, renseigné avec la plus grande précision. »

Avec Data Profiling, Médiamétrie élabore une méthodologie spécifique pour chaque client. Celle-ci se déroule en plusieurs étapes qui s’échelonnent sur une période d’environ trois mois. Après avoir collecté et analysé les données de consommation de leurs contenus fournies par ses clients, le système exclusif et automatisé créé par Médiamétrie reposant sur l’Intelligence Artificielle sélectionne le ou les algorithmes les plus pertinents. Il utilise pour cela les données issues de ses panels TV et Internet, qui eux, possèdent les données de profils précises. A partir de l’expertise métier des équipes Data Science de Médiamétrie, des milliers de paramètres explicatifs des différents profils sont constitués : ils consistent à identifier les profils sociodémographiques associés à des comportements et d’habitudes de consommation du replay TV ou d’internet. Ces paramètres comprennent par exemple les sites consultés ou les types de programmes regardés, l’heure de consultation, le jour de la semaine, et bien d’autres. C’est ce qu’on appelle le « feature engineering ». Ces paramètres, convertis en données mathématiques par une méthode de deep learning, sont ensuite injectées dans le modèle défini. Celui-ci, grâce à l’intelligence artificielle (machine learning), s’entraîne à reconnaître les profils associés aux différents usages. Après la réalisation de tests et d’éventuels ajustements, le modèle est appliqué aux milliards de données fournies par l’éditeur TV ou Internet : le modèle qualifie ainsi les identifiants de l’éditeur TV ou les cookies pour Internet, avec un profil sociodémographique.

méthodologie Data Profiling

Pour Estelle Duval : « Data Profiling se fonde sur un ensemble de méthodes permettant de s’adapter aux différents besoins et aux données particulières de nos clients. Chacun nécessite une étude approfondie et une solution spécifique pour être traitée, faisant appel à la fois aux technologies les plus poussées d’intelligence artificielle, et à l’expertise métiers de Médiamétrie sur les médias ».

Une performance du ciblage publicitaire accrue

Pour s’assurer de la performance des campagnes publicitaires conduites à partir de Data Profiling, Médiamétrie effectue ensuite un bilan de campagne avec ses outils Digital Ad Ratings pour Internet et Médiamat pour la TV. Les bilans réalisés confirment que Data Profiling optimise significativement les résultats.

Lancé en 2019, Data Profiling est aujourd’hui utilisé par TF1 pour ses campagnes de publicité en IPTV sur MYTF1 et par Webedia pour l’ensemble de ses sites Internet web et mobile.

Médiamétrie qualifie quotidiennement les cookies des éditeurs Internet. Sur les sites de Webedia, une campagne ciblant les femmes 25-49 ans conduite sur la base des qualifications Data Profiling atteint un taux de 49% d’impressions sur cible ; cela correspond à une augmentation de 18 points par rapport aux normes des campagnes mesurées par Digital Ad Ratings. Pour les hommes de cette tranche d’âge, le taux d’impressions sur cible s’élève à 66%, soit 30 points de plus que les normes DAR.

De même, pour TF1, on observe des taux d’atteinte sur cible compris entre 60% (femmes 25-49 ans) et 85% (individus 25-49 ans) constatés sur des bilans de campagne IPTV. Soit des niveaux analogues à ceux constatés via DAR pour l’offre logguée de TF1.

Le ciblage est ainsi deux fois plus performant que le ciblage standard proposé sur le marché.

Pour Antoine Meunier, Directeur Général Adjoint en charge du Marketing, des Etudes et de la Communication de Webedia : « nous sommes fiers de pouvoir compléter notre proposition de valeur sur la data : la qualification quotidienne, par Médiamétrie, de nos profils d’audience sur 6 cibles socio-démographiques stratégiques pour nos clients est une véritable innovation qui permet d’allier la qualité du ciblage et la volumétrie des segments activables ».

Philippe Boscher, Directeur adjoint marketing digital, One Data, études, R&D de TF1 Publicité souligne : « cette initiative est une belle démonstration de l’utilisation de la data science au service de l’optimisation de l’expérience publicitaire sur l’écran de TV et nous ouvre des perspectives intéressantes pour la télévision adressable. »

 

Laure Osmanian Molinero

 

Calcul d’intervalle de confiance à 95%

Taille de l'échantillon ou d'une cible dans l'échantillon

n =

Proportion observée dans l'échantillon ou sur une cible dans l'échantillon

p =

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

Test de significativité des écarts entre deux proportions

Permet d'évaluer si la différence entre 2 proportions est significative au seuil de 95%

Proportion

Taille de l'échantillon

Échantillon 1

%

Échantillon 2

%

Attention : ne s'applique qu'à une proportion. Le Taux Moyen est une moyenne de proportions et la Part d'audience un rapport de proportions.
Cet outil est donné à titre indicatif. Il ne saurait pouvoir s'appliquer sans autres précautions à des fins professionnelles.

En complément