L’économie chinoise se transforme en économie numérique

La semaine dernière l’équipementier chinois Huawei réunissait 10.000 personnes à Shanghai pour le Huawei Cloud Congress (HCC 2015) . J’avais le plaisir d’être présent et de découvrir à cette occasion Shanghai et la société Huawei.

IMG_2752

La société chinoise mise sur le numérique pour poursuivre sa transformation. La nouvelle économie chinoise ne semble rien avoir à envier à celle des Etats Unis. La société chinoise se numérise avec l’adoption des smartphones, de l’internet des objets et du big data. En mars 2015 , le gouvernement chinois a lancé le programme Internet Plus pour accélérer le mouvement. La Chine compte par exemple sur le numérique pour accélérer la modernisation de son système de soins et arriver au niveau des standards internationaux de la santé en 2020. Shanghai fait déjà figure d’exemple mondial. Face à une population vieillissante de 46 millions d’habitants la ville arrive à réduire progressivement ses dépenses de santé tout en en améliorant la qualité des soins grâce à la numérisation et l’historisation des données patient associées à des technologies de big data.

Des géants chinois que l’on commence à découvrir. En Chine on ne parle pas de « GAFA » mais de « BAT » (Baidu, Alibaba,Tencent) qui peuvent compter sur 668 millions d’internautes chinois contre 280 millions aux Etats-Unis  ( lire l’article « Ces géants chinois aussi forts que Facebook, Google ou Amazon » ) . On connait souvent mal les entreprises chinoises jusqu’au jour où elles sortent de leur pays. On découvre alors leurs tailles et leur potentiel. C’est le cas de Huawei qui compte 170 000 personnes dans le monde et un chiffre d’affaires de 46,5 milliards de dollars en 2014.

En septembre 2014 Ren Zhengfei, le fondateur de Huawei s’est déplacé en France pour rencontrer le premier ministre à l’occasion d’un plan d’investissement sur trois ans de 1,5 milliard d’euros en France  concernant le domaine des smartphones.

Huawei affiche ses ambitions dans le Cloud. Durant le HCC 2015 l’activité Cloud et DataCenter était à l’honneur. Le CEO Eric XU a clairement affiché son ambition de devenir un leader mondial du cloud public pensant avoir tous les atouts pour concurrencer les acteurs issus du monde de l’internet. Le service de cloud est déjà disponible en Chine depuis juillet 2015. A l’extérieur de la Chine Huawei s’appuiera sur des opérateurs télécom partenaires pour commercialiser ses services de cloud public. Deutsche Telecom travaille déjà étroitement avec Huawei dans ce sens et compte également bénéficier de l’aide de Huawei pour se développer en Chine.

Criteo s’équipe de serveurs Huawei pour son cluster Hadoop. Parmi les intervenants Huawei serveron pouvait noter la présence de Matthieu Blumberg de Criteo ( le spécialiste du display sur internet) venu expliquer le choix récent de  700 serveurs Fusionserver de Huawei pour équiper le nouveau cluster hadoop dans son datacenter à Pantin. Une référence importante pour Huawei quand on sait que Criteo possède le plus grand cluster hadoop européen. Cette nouvelle plateforme Hadoop équipée de Serveurs Huawei, améliorera l’efficacité du moteur Criteo grâce à un gain de performances de traitement de 30%

Le film d’animation « les Minions » basé sur du stockage Huawei. On pouvait croiser Minions OceanStordans les allées des stands un « Minion » sorti tout droit du film d’animation produit par Illumination Mac Guff  (né en 2011 du rachat du Français Mac Guff par l’Américain Illumination, propriété d’Universal Pictures) dont les studios sont basés à Paris et qui produit des films d’animation aussi bien pour Hollywood que pour Universal studio. La raison de la présence de ce Minion à Shanghai ? Le choix des solutions de stockage OceanStor V3 de Huawei connectées au cluster utilisé pour produire le film d’animation.

On voit au travers de ses quelques exemples que Huawei a su faire évoluer rapidement ses technologies et qu’au-delà des smartphones le géant chinois à de belles ambitions dans le marché de l’IT au-delà de ses frontières.

Ciblage publicitaire par Criteo : #bigdata et confidentialité

Les technologies de machine learning permettent des reciblages publicitaires personnalisés. Criteo est passé maitre dans ce domaine et assure respecter la confidentialité des internautes qui gardent la possibilité de se soustraire à ces publicités

Le reciblage publicitaire est un enjeu important pour les sites de e-commerce puisque l’on sait que 97% des visiteurs d’un site le quittent sans avoir acheté.Les techniques de reciblage publicitaire vont proposer à des visiteurs volatiles des publicités personnalisées sur les autres sites qu’ils vont visiter. C’est un domaine ou Criteo s’est imposé comme un des leaders et il est souvent cité en exemple de la réussite des startups française. Dans une « interview numérique » réalisée par Alice Antheaume, Grégory Gazagne, directeur général de Criteo explique le fonctionnement de ces publicités en ligne. (voir l’enregistrement de l’interview)

Criteo ITW V1

Le reciblage publicitaire c’est d’abord une course de vitesse. Criteo réussit à créer de manière dynamique une bannière dynamique en 6ms après avoir négocié en temps réel (Real Time Bidding RTB) le prix de l’espace sur un Ad Exchange (place de marché spécialisée). Pour réussir cette performance Critéo a développé 3 types d’algorithme de machine learning:

  • Un algorithme de recommandation qui détermine les produits les plus pertinents à afficher pour optimiser le taux de conversion.
  • Un algorithme qui calcule en temps réel la valeur pour chaque internaute (taux d eclic, taux de conversion de manière à estimer le meilleur prix.
  • Un algorithme de création dynamique de bannière.

La performance est d’autant plus impressionnante que les algorithmes de Criteo analysent plus de 230 téraoctets de données par jour et traite 15 millions de requêtes à la seconde. Près d’un milliard d’internautes sont ainsi ciblés chaque mois par les publicités affichées par Criteo. Ce sont près de 3 milliards de bannières publicitaires affichées par jour. Pour réussir ses prouesses Criteo dispose de 5 centres informatiques sur 3 continents et un important cluster hadoop pour gérer ses « Big Data ».

L’internaute peut se prémunir du reciblage publicitaire. Certains apprécieront le reciblage publicitaire si les recommandations sont pertinentes, d’autres peuvent se sentir agressés voir harcelés. Criteo propose une fonction qui permet de se désinscrire vis-à-vis d’un annonceur mais on peut également se soustraire à ces publicités en utilisant le site Your Online Choices . Cela ne désactive pas toutes les pubs internet mais seulement celles qui sont basées sur vos centres d’intérêt définis en fonction de votre activité internet et navigation antérieure.

Ciblage publicitaire et confidentialité est-ce possible ? La question revient de plus en plus souvent et commencent à inquiéter car le nombre d’informations que chacun d’entre nous laisse à son insu sur internet est considérable. Grégory Gazagne nous rassure sur ce point en indiquant que toutes les données utilisées par Criteo sont sub-anonymes. C’est-à-dire qu’elles sont liées à l’utilisateur sans savoir qui il est car ce qui intéresse Criteo c’est l’intention d’achat. Criteo a d’ailleurs définit une charte de vie privée disponible sur son site  ou il est expliqué que « Les informations personnelles dont nous avons connaissance, comme votre nom ou votre adresse e-mail, sont uniquement celles que vous décidez de nous fournir lorsque vous remplissez le formulaire de contact disponible sur notre site Web » et que « Des cookies sont utilisés sur notre site Web. Qui collectent des données non personnelles relatives à votre navigation sur notre site Web »

 

Avec le Big Data c’est avant tout de l’économie de la donnée dont on parle

La médiatisation du déluge de données, avec ses chiffres gigantesques, pourrait faire penser que le big data est un domaine réservé aux très grandes entreprises . C’est avant tout de l’économie de la data dont on parle, cela concerne tout le monde et donne naissance à de prometteuses startups françaises.

billet bigdata

Le Big Data : une réponse à des limites techniques

Revenons à quelques notions essentielles. Le déluge de données, mis en avant en 2010 par The Economist, a souligné les problèmes techniques qui allaient se poser. Comment bâtir des architectures capables d’absorber en flux continu des quantités énormes de données et pour un cout acceptable ? Les grands acteurs du Web comme Yahoo et Google ont été les tous premiers à être confrontés à ce problème dès 2004.

Cela a donné naissance au fameux « frameworks » Hadoop  pour constituer des « data-lakes » ou des « data-hubs » capables d’être alimentés en continu par diverses sources de données et de pouvoir s’étendre facilement au gré de la croissance des données. Des bases de données NoSQL sont apparues également pour apporter des réponses en termes de performances et d’extensibilité (scalabilité) là où les bases de données relationnelles montraient leurs limites. On apportait ainsi une réponse technique au problème de gestion de la quantité et de la diversité des données.

L’important c’est la data

Seuls 2 à 3% des données sont réellement exploités. Le terme Big Data est un vecteur médiatique non négligeable qui a permis de sensibiliser le plus grand nombre à la valeur potentielle de la donnée et à son poids grandissant dans l’économie mais il devient trop imprécis quand on s’attaque aux réels cas d’usage.

La finalité est la création de la valeur à partir des données. Les algorithmes et le machine learning prennent ainsi une place grandissante pour exploiter avec de plus en plus de pertinence les données.

Avoir un projet Big Data n’est pas un objectif en soi et n’a pas de réelle signification. La véritable stratégie consiste à identifier les sources de données disponibles et à imaginer les cas d’usages qui pourraient bénéficier à l’entreprise. Ensuite viendra la question de l’architecture à mettre en place. Les choix technologiques dépendront alors de la volumétrie, de la diversité, du flux des données et de la performance d’accès nécessaire.

Selon le contexte de l’entreprise et des cas d’usage, les data seront « Big », « Small » ou « fast » et l’architecture technique sera bâtie en conséquence. On devra tenir compte des perspectives et de la stratégie de l’entreprise pour avoir une cohérence d’ensemble et une pérennité des choix. Au-delà des aspects techniques, l’organisation et les interactions entre les directions métiers et la direction informatique seront essentielles pour éviter la juxtaposition de solutions disparates.

Le Big Data dans l’entreprise ou dans le Cloud :

Axelle Lemaire, secrétaire d’état au numérique, a encore rappelé, lors du débat d’orientation stratégique à l’assemblée nationale, l’importance de l’économie de la donnée. Toutes les entreprises doivent se sentir concernées par cette économie de la donnée et peuvent, selon leur taille et leur prévision, mettre en œuvre des solutions de Big Data dans leur centre informatique ou bien utiliser des services de big data dans le cloud.

On peut se réjouir de voir en France de nombreuses startups innover dans le domaine du Big Data. Impossible de toutes les citer mais en voici quelques-unes qui me paraissent intéressantes :

Criteo: Une réussite pour ce spécialiste français du re-targeting. De nombreuses sociétés de e-commerce utilisent ses solutions basées sur des technologies de big data performantes afin d’inciter les internautes à revenir sur leurs sites marchand.

VirtualScale : Considérée par EBG comme une des 10 startups les plus prometteuses, cette jeune société française propose des solutions d’infrastructure Big Data dans le Cloud.

Quasardb : A ma connaissance c’est la seule solution européenne de type NoSQL et elle est française. Elle se présente comme la nouvelle génération des bases de données NoSQL. Elle a annoncé tout dernièrement son intention d’offrir la solution dans  le cloud Azure de Microsoft

Tastehit : Cette toute jeune société, passée par l’incubateur NUMA, utilise le machine learning pour personnaliser un site commerçant en fonction du visiteur et l’inciter à rester sur le site. La solution, simple de mise en œuvre, est proposée sous forme d’un logiciel en mode SaaS (software as a service) dans le cloud. L’architecture de type NoSQL utilisée par Tastehit est hébergée par un opérateur de cloud..

A n’en pas douter les entreprises qui n’auront pas su, dans l’avenir, exploiter les données perdront un sérieux avantage concurrentiel et passeront à côté de nouvelles opportunités commerciales.