Ciblage publicitaire par Criteo : #bigdata et confidentialité

Les technologies de machine learning permettent des reciblages publicitaires personnalisés. Criteo est passé maitre dans ce domaine et assure respecter la confidentialité des internautes qui gardent la possibilité de se soustraire à ces publicités

Le reciblage publicitaire est un enjeu important pour les sites de e-commerce puisque l’on sait que 97% des visiteurs d’un site le quittent sans avoir acheté.Les techniques de reciblage publicitaire vont proposer à des visiteurs volatiles des publicités personnalisées sur les autres sites qu’ils vont visiter. C’est un domaine ou Criteo s’est imposé comme un des leaders et il est souvent cité en exemple de la réussite des startups française. Dans une « interview numérique » réalisée par Alice Antheaume, Grégory Gazagne, directeur général de Criteo explique le fonctionnement de ces publicités en ligne. (voir l’enregistrement de l’interview)

Criteo ITW V1

Le reciblage publicitaire c’est d’abord une course de vitesse. Criteo réussit à créer de manière dynamique une bannière dynamique en 6ms après avoir négocié en temps réel (Real Time Bidding RTB) le prix de l’espace sur un Ad Exchange (place de marché spécialisée). Pour réussir cette performance Critéo a développé 3 types d’algorithme de machine learning:

  • Un algorithme de recommandation qui détermine les produits les plus pertinents à afficher pour optimiser le taux de conversion.
  • Un algorithme qui calcule en temps réel la valeur pour chaque internaute (taux d eclic, taux de conversion de manière à estimer le meilleur prix.
  • Un algorithme de création dynamique de bannière.

La performance est d’autant plus impressionnante que les algorithmes de Criteo analysent plus de 230 téraoctets de données par jour et traite 15 millions de requêtes à la seconde. Près d’un milliard d’internautes sont ainsi ciblés chaque mois par les publicités affichées par Criteo. Ce sont près de 3 milliards de bannières publicitaires affichées par jour. Pour réussir ses prouesses Criteo dispose de 5 centres informatiques sur 3 continents et un important cluster hadoop pour gérer ses « Big Data ».

L’internaute peut se prémunir du reciblage publicitaire. Certains apprécieront le reciblage publicitaire si les recommandations sont pertinentes, d’autres peuvent se sentir agressés voir harcelés. Criteo propose une fonction qui permet de se désinscrire vis-à-vis d’un annonceur mais on peut également se soustraire à ces publicités en utilisant le site Your Online Choices . Cela ne désactive pas toutes les pubs internet mais seulement celles qui sont basées sur vos centres d’intérêt définis en fonction de votre activité internet et navigation antérieure.

Ciblage publicitaire et confidentialité est-ce possible ? La question revient de plus en plus souvent et commencent à inquiéter car le nombre d’informations que chacun d’entre nous laisse à son insu sur internet est considérable. Grégory Gazagne nous rassure sur ce point en indiquant que toutes les données utilisées par Criteo sont sub-anonymes. C’est-à-dire qu’elles sont liées à l’utilisateur sans savoir qui il est car ce qui intéresse Criteo c’est l’intention d’achat. Criteo a d’ailleurs définit une charte de vie privée disponible sur son site  ou il est expliqué que « Les informations personnelles dont nous avons connaissance, comme votre nom ou votre adresse e-mail, sont uniquement celles que vous décidez de nous fournir lorsque vous remplissez le formulaire de contact disponible sur notre site Web » et que « Des cookies sont utilisés sur notre site Web. Qui collectent des données non personnelles relatives à votre navigation sur notre site Web »