Recommandations et publicités : une approche différente de la personnalisation

Les consommateurs ont rarement une idée précise de ce qui arrive aux données qu’ils contribuent à générer lors de leurs visites et de leurs alexei-v1achats sur des sites de e-commerce. Ces données personnelles sont pourtant largement utilisées dans un but de personnalisation et de publicité. Pour comprendre l’usage qui en fait j’ai demandé quelques explications à  Alexei Kounine, CEO de la société TasteHit spécialiste de la personnalisation de site e-commerce.

recommandation-marketing

Les systèmes de recommandations apportent un service sur mesure. Aujourd’hui Il est relativement aisé de collecter, sur les sites web, de grandes quantités de données anonymes sur le comportement des utilisateurs. Elles sont personnelles car elles concernent un individu, elles sont anonymes car on ne peut pas savoir en principe qui est l’individu sans son consentement.  Ces données peuvent ensuite être analysées par des algorithmes de machine learning (des systèmes d’autoapprentissage) et l’historique de recherche d’un utilisateur peut être comparé aux comportements de millions d’utilisateurs pour réaliser des prédictions et créer une expérience personnalisée. C’est ce qu’on appelle le « filtrage collaboratif » (collaborative filtering en anglais) qui est utilisé par les systèmes de recommandation. On se sert des opinions et des évaluations d‘un grand nombre d’utilisateurs pour personnaliser une recommandation vers un individu.  Nous avons tous fait l’expérience consciemment ou non de cette « expérience tastehit-image-2personnalisée ». C’est le cas quand nous lisons le fil d’actualités de nos comptes Facebook et Twitter ou si nous regardons des vidéos sur Netflix ou bien encore quand nous faisons défiler les produits sur Amazon. Le choix du contenu et l’ordre dans lequel il nous est présenté dépend de notre comportement passé et des services utilisés. Chacun des 1,7 milliards d’utilisateurs Facebook a une vue de son compte Facebook totalement personnalisé en fonction des données collectées par le numéro 1 des réseaux sociaux.

Le cookie, pierre angulaire de la personnalisation. Lorsque les systèmes de recommandations sont bien pensés, ils sont généralement bien perçus et considérés quasiment comme un service en soi. C’est particulièrement le cas pour la recommandation de morceaux de musique par Spotify, de films par NetFlix ou de produits sur des sites e-commerce. Mais ce n’est pas toujours le cas et de nombreuses publicités personnalisées sont perçues comme intrusives par les consommateurs qui ont réagi en adoptant rapidement des « ad blockers ». Pour comprendre ces réactions il faut revenir sur le rôle du cookie. Le cookie est un petit fichier texte stocké dans le browser de l’équipement que nous utilisons pour aller sur le web. Ces cookies aident les sites web à se souvenir de qui nous sommes et à collecter des données sur les clics des consommateurs. Sans ces cookies, un site n’a aucun moyen de savoir que c’est la même personne qui fait deux requêtes consécutives sur des pages différentes. L’utilisation des cookies est très répandue car c’est le moyen de garantir que nos paramètres de navigation sont gardés entre deux pages d’un même site. Pour être plus précis les cookies sont les mécanismes qui permettent d’assurer par exemple une continuité de l’expérience utilisateur entre la consultation de produits, l’achat et la confirmation de paiement. Ils sont aussi utilisés pour faire des recommandations personnalisées de produits. Ce type de cookies placés par le site visité pour suivre l’activité sur ce site s’appelle un « first » cookie. Ces cookies complétées par des données comportementales et contextuelles de plus en plus nombreuses pour atteindre une hyper-personnalisation et obtenir des systèmes de recommandations performants.

Certains cookies nous suivent à la trace. Les cookies sont utiles pour la personnalisation et la navigation sur un site, pourtant certains s’en méfient comme de la peste. Il y a une raison à cette méfiance. Vous avez sans doute remarqué que lorsque vous passez d’un site web à un autre,  il est fréquent qu’apparaisse sur le nouveau site que vous visitez une publicité qui concerne comme par hasard le produit sur lequel vous aviez cliqué sur un site précédent. C’est un autre type de cookie qui est utilisé pour nous pister ainsi de site en site : le « third party cookie ». En fait lors d’une visite d’un site web, ce site fait appel à une société tierce pour placer leurs cookies dans notre browser. Pour faire simple, ce cookie contient un identifiant unique, qui ne permet pas de savoir nommément qui nous sommes, mais qui indique par exemple ce que nous avons précédemment acheté ou consulté. Le mécanisme qui utilise ces cookies pour présenter des publicités concernant des produits visités sur d’autres sites s’appelle le « retargeting ». Le consommateur qui cliquera sur la publicité va être redirigé vers le site d’origine ou le produit avait été consulté.

Une personnalisation hors du contexte rebute le consommateur. Le consommateur n’est pas au courant de tous ces processus mis en place et n’a en général jamais entendu parler de sociétés de retargeting qui traquent le comportement des consommateurs sur tout le web. La personnalisation n’est pas celle que pourrait espérer le consommateur. Au contraire il peut éprouver le sentiment d’être épié et suivi si par exemple lorsqu’il est sur un site d’électroménager, une publicité lui présente une paire de chaussures consultée sur un autre site. Cette personnalisation qui est sortie du contexte explique en partie le rejet du consommateur pour ces publicités ciblées.

A lire également pour comprendre les modèles économiques des acteurs de la publicité en ligne:  How your personal data is used in personalization and advertising

Ciblage publicitaire par Criteo : #bigdata et confidentialité

Les technologies de machine learning permettent des reciblages publicitaires personnalisés. Criteo est passé maitre dans ce domaine et assure respecter la confidentialité des internautes qui gardent la possibilité de se soustraire à ces publicités

Le reciblage publicitaire est un enjeu important pour les sites de e-commerce puisque l’on sait que 97% des visiteurs d’un site le quittent sans avoir acheté.Les techniques de reciblage publicitaire vont proposer à des visiteurs volatiles des publicités personnalisées sur les autres sites qu’ils vont visiter. C’est un domaine ou Criteo s’est imposé comme un des leaders et il est souvent cité en exemple de la réussite des startups française. Dans une « interview numérique » réalisée par Alice Antheaume, Grégory Gazagne, directeur général de Criteo explique le fonctionnement de ces publicités en ligne. (voir l’enregistrement de l’interview)

Criteo ITW V1

Le reciblage publicitaire c’est d’abord une course de vitesse. Criteo réussit à créer de manière dynamique une bannière dynamique en 6ms après avoir négocié en temps réel (Real Time Bidding RTB) le prix de l’espace sur un Ad Exchange (place de marché spécialisée). Pour réussir cette performance Critéo a développé 3 types d’algorithme de machine learning:

  • Un algorithme de recommandation qui détermine les produits les plus pertinents à afficher pour optimiser le taux de conversion.
  • Un algorithme qui calcule en temps réel la valeur pour chaque internaute (taux d eclic, taux de conversion de manière à estimer le meilleur prix.
  • Un algorithme de création dynamique de bannière.

La performance est d’autant plus impressionnante que les algorithmes de Criteo analysent plus de 230 téraoctets de données par jour et traite 15 millions de requêtes à la seconde. Près d’un milliard d’internautes sont ainsi ciblés chaque mois par les publicités affichées par Criteo. Ce sont près de 3 milliards de bannières publicitaires affichées par jour. Pour réussir ses prouesses Criteo dispose de 5 centres informatiques sur 3 continents et un important cluster hadoop pour gérer ses « Big Data ».

L’internaute peut se prémunir du reciblage publicitaire. Certains apprécieront le reciblage publicitaire si les recommandations sont pertinentes, d’autres peuvent se sentir agressés voir harcelés. Criteo propose une fonction qui permet de se désinscrire vis-à-vis d’un annonceur mais on peut également se soustraire à ces publicités en utilisant le site Your Online Choices . Cela ne désactive pas toutes les pubs internet mais seulement celles qui sont basées sur vos centres d’intérêt définis en fonction de votre activité internet et navigation antérieure.

Ciblage publicitaire et confidentialité est-ce possible ? La question revient de plus en plus souvent et commencent à inquiéter car le nombre d’informations que chacun d’entre nous laisse à son insu sur internet est considérable. Grégory Gazagne nous rassure sur ce point en indiquant que toutes les données utilisées par Criteo sont sub-anonymes. C’est-à-dire qu’elles sont liées à l’utilisateur sans savoir qui il est car ce qui intéresse Criteo c’est l’intention d’achat. Criteo a d’ailleurs définit une charte de vie privée disponible sur son site  ou il est expliqué que « Les informations personnelles dont nous avons connaissance, comme votre nom ou votre adresse e-mail, sont uniquement celles que vous décidez de nous fournir lorsque vous remplissez le formulaire de contact disponible sur notre site Web » et que « Des cookies sont utilisés sur notre site Web. Qui collectent des données non personnelles relatives à votre navigation sur notre site Web »