Ciblage publicitaire par Criteo : #bigdata et confidentialité

Les technologies de machine learning permettent des reciblages publicitaires personnalisés. Criteo est passé maitre dans ce domaine et assure respecter la confidentialité des internautes qui gardent la possibilité de se soustraire à ces publicités

Le reciblage publicitaire est un enjeu important pour les sites de e-commerce puisque l’on sait que 97% des visiteurs d’un site le quittent sans avoir acheté.Les techniques de reciblage publicitaire vont proposer à des visiteurs volatiles des publicités personnalisées sur les autres sites qu’ils vont visiter. C’est un domaine ou Criteo s’est imposé comme un des leaders et il est souvent cité en exemple de la réussite des startups française. Dans une « interview numérique » réalisée par Alice Antheaume, Grégory Gazagne, directeur général de Criteo explique le fonctionnement de ces publicités en ligne. (voir l’enregistrement de l’interview)

Criteo ITW V1

Le reciblage publicitaire c’est d’abord une course de vitesse. Criteo réussit à créer de manière dynamique une bannière dynamique en 6ms après avoir négocié en temps réel (Real Time Bidding RTB) le prix de l’espace sur un Ad Exchange (place de marché spécialisée). Pour réussir cette performance Critéo a développé 3 types d’algorithme de machine learning:

  • Un algorithme de recommandation qui détermine les produits les plus pertinents à afficher pour optimiser le taux de conversion.
  • Un algorithme qui calcule en temps réel la valeur pour chaque internaute (taux d eclic, taux de conversion de manière à estimer le meilleur prix.
  • Un algorithme de création dynamique de bannière.

La performance est d’autant plus impressionnante que les algorithmes de Criteo analysent plus de 230 téraoctets de données par jour et traite 15 millions de requêtes à la seconde. Près d’un milliard d’internautes sont ainsi ciblés chaque mois par les publicités affichées par Criteo. Ce sont près de 3 milliards de bannières publicitaires affichées par jour. Pour réussir ses prouesses Criteo dispose de 5 centres informatiques sur 3 continents et un important cluster hadoop pour gérer ses « Big Data ».

L’internaute peut se prémunir du reciblage publicitaire. Certains apprécieront le reciblage publicitaire si les recommandations sont pertinentes, d’autres peuvent se sentir agressés voir harcelés. Criteo propose une fonction qui permet de se désinscrire vis-à-vis d’un annonceur mais on peut également se soustraire à ces publicités en utilisant le site Your Online Choices . Cela ne désactive pas toutes les pubs internet mais seulement celles qui sont basées sur vos centres d’intérêt définis en fonction de votre activité internet et navigation antérieure.

Ciblage publicitaire et confidentialité est-ce possible ? La question revient de plus en plus souvent et commencent à inquiéter car le nombre d’informations que chacun d’entre nous laisse à son insu sur internet est considérable. Grégory Gazagne nous rassure sur ce point en indiquant que toutes les données utilisées par Criteo sont sub-anonymes. C’est-à-dire qu’elles sont liées à l’utilisateur sans savoir qui il est car ce qui intéresse Criteo c’est l’intention d’achat. Criteo a d’ailleurs définit une charte de vie privée disponible sur son site  ou il est expliqué que « Les informations personnelles dont nous avons connaissance, comme votre nom ou votre adresse e-mail, sont uniquement celles que vous décidez de nous fournir lorsque vous remplissez le formulaire de contact disponible sur notre site Web » et que « Des cookies sont utilisés sur notre site Web. Qui collectent des données non personnelles relatives à votre navigation sur notre site Web »

 

2 réflexions sur “Ciblage publicitaire par Criteo : #bigdata et confidentialité

  1. Guillaume 5 mars 2015 / 11 h 40 min

    Plutôt que de faire de l’opt-out (c’est-à-dire cliquer sur le petit « i » des publicités de Criteo pour *chaque* annonceur), prenez les devants et désactivez dans votre navigateur les cookies tiers (third-party cookies) qui ne vous serons d’aucune utilisé dans votre navigation Web quotidienne et n’ont qu’une utilité : le tracking publicitaire.

    Les initiatives privées du type Your Online Choice ou Do Not Track sont une très mauvaise réponse au problème de confidentialité de la navigation sur le Web.

    Ce que cet article et cette interview ne disent pas, ce sont les nouvelles techniques de pistage de l’internaute qui ne passent plus par la dépose d’un cookie de suivi. On les appelle des empreintes numériques (browser fingerprinting) : votre système d’exploitation, votre adresse IP, la marque de votre navigateur Web, la résolution d’écran de votre système, etc.

    Cet ensemble de données permet de vous identifier à coup sûr sans possibilité d’y remédier.

    Si vous souhaitez aller plus loin en matière de protection de la vie privée lors de vos pérégrinations sur le Web : http://vialet.org/blog/post/2013/07/Do-Not-Track-faites-le-vous-meme

    J'aime

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s