China Big Data, les données au coeur d’un communisme capitaliste high-tech

Par Kati Bremme, Direction de l’Innovation et de la Prospective.

Retour d’un voyage en Chine avec le Hub France IA, dont France Télévisions est membre, sur invitation de la China Big Data Exposition* à Guiyang, avec une learning expedition à Hangzhou et Pékin organisée par la French Tech Beijing.

"A l’Ouest, tout est simple, mais rien n’est possible. En Chine, tout est compliqué, mais tout est possible". Ainsi pourrait-on résumer l’écosystème d’innovation, et en particulier de l’intelligence artificielle (IA), de l’Empire du Milieu, qui marie high tech et culture millénaire sur fond de capacité de transformation impressionnante. L’IA est devenue ces dernières années un des domaines privilégiés de compétitivité de la Chine, à la fois comme un moyen de maintien de la stabilité interne et comme une ressource stratégique dans les relations diplomatiques et économiques internationales. Depuis deux ans, cette volonté est clairement exprimée dans un vaste plan de support par le gouvernement, qui vise à faire de la Chine le leader mondial de l’Intelligence Artificielle à horizon 2030.

Une histoire de nombres

Pour se représenter le potentiel chinois en termes de Big Data - et donc d’IA et d’apprentissage automatique (dont les données sont la principale nourriture) - il s’agit de comprendre non seulement le contexte politique, et surtout quelques chiffres. Kai-Fu Lee résume la situation dans son livre AI Superpowers : "La Chine est l’Arabie Saoudite des données".

Les grandes plateformes Baidu, Alibaba et Tencent disposent de plus de données que les Etats-Unis et l’Europe réunis. Le 1,4 milliard de Chinois, reparti dans 160 villes de plus d’un million d’habitants, est de plus en plus connecté, soutenu en cela par les investissements massifs dans la 4G, puis la 5G : on compte 900 millions d'internautes chinois (deux fois la population des Etats-Unis, 21% de l’ensemble des utilisateurs d’Internet dans le monde, selon Mary Meeker), dont 98% utilisateurs sur mobile, fournissant une quantité importante d’informations à disposition des BATX, et, par extension, du gouvernement chinois. Avec une application de plus en plus étendue des technologies numériques en Chine, le pays devrait générer et stocker 27,8% des données mondiales en ligne d'ici 2025, selon un rapport de l’institut de recherche International Data Corp avec Seagate. 

La Chine est passée depuis longtemps de l’imitation à l’innovation. On compte 186 licornes en Chine, plus de 4.000 incubateurs, et des fonds d’investissements aux moyens presque illimités (comme Sequoia Capital, Tencent ou Sinovation Ventures de Kai-Fu Lee). Les investissements sont souvent pilotés par le gouvernement, qui met en place un écosystème très favorable pour le développement de l’innovation dans les secteurs stratégiques, y compris en modulant jusqu’aux frais de l’électricité et de location. Là où l’Europe cède souvent ses start-ups aux investisseurs américains ou asiatiques une fois atteint une certaine taille, la Chine permet à son écosystème d'innovation de se mettre à l’échelle de la demande. Et pour booster l’innovation, les grandes plateformes des BATX n’hésitent pas à se lancer dans une concurrence féroce entre-elles (WeChat Pay vs AliPay). C'est aussi en Chine que l'on trouve la start-up IA la plus valorisée au monde

Depuis 2017, toutes les universités chinoises proposent des formations en intelligence artificielle et produisent des dizaines de milliers de chercheurs en IA tous les ans. Certaines écoles primaires commencent même à enseigner l’IA. La Chine ne compte pas une, mais plusieurs "Silicon Valley" de l’IA, soutenues par le gouvernement national et les pouvoirs régionaux. Elle vient de lancer le 13 juin à Shanghai sa plate-forme boursière dédiée aux valeurs technologiques, son propre Nasdaq chinois.

Le Big Data dans les montagnes chinoises

L’un des exemples du pouvoir de transformation du gouvernement est la région autour de Guiyang, première étape de notre voyage en Chine.  


Vue de Guiyang depuis les montagnes environnantes

Autrefois ville isolée dans une région montagneuse du sud-ouest de la Chine, Guiyang est devenue en quelques années le cœur d’une "Big Data Valley" profitant de l’essor du traitement des données massives, du cloud et de l’Internet des Objets dont les données récoltées nécessitent d’immenses espaces de stockage. C’est dans la province de Guizhou que le gouvernement chinois a décidé d’installer ses plus grands data centers, un choix favorisé par le climat, les sources d’énergie disponibles à proximité et la géodynamique. Dès 2013, la région est nommée terrain pilote pour le big data.

Les données des utilisateurs chinois n’ayant pas le droit de sortir de Chine, certains acteurs internationaux commencent à y installer leur cloud, comme Intel et Dell, et Apple, qui a construit son centre de données en février 2018 (contrairement à Facebook qui refuse de stocker les données de ses clients sur le territoire chinois). Guiyang est aussi le siège de l’entreprise Global Big Data Exchange (GBDEx), la première, et la plus grande, plateforme de commercialisation de mégadonnées en Chine, propriété de la région, avec des pouvoirs publics qui sont à la fois vendeurs et acheteurs de milliards de données (anonymisées).


Tableau de bord de la GBDEx qui commercialise des données à destination d’entreprises chinoises

La "Big Data Expo" : collaborer autour des données

Pour renforcer la visibilité de cette volonté d’investissement dans le big data, Guiyang accueille chaque année la "China International Big Data Expo", sorte de VivaTech chinoise, avec des conférences qui affichent la stratégie nationale autour de l’IA. En pleine guerre commerciale avec les Etats-Unis, le discours d’ouverture du président Xi Jinping a mis cette année en avant l’importance de la collaboration autour de la donnée. Il appelle à une "coopération internationale autour du numérique", soulignant que les pays "doivent renforcer leurs liens et approfondir leurs échanges" pour saisir les opportunités de la "transformation digitale, du travail en réseau et du développement de l’intelligence" dans les domaines juridiques, sécuritaires et de gouvernance autour du big data.

Depuis sa première édition en 2015, l’exposition s’internationalise de plus en plus (même si toutes les diapositives des conférences restent en chinois). L’édition 2019 a attiré 501 entreprises de 59 pays et régions dont 36 impliquées dans la "Nouvelle Route de la Soie". L’un des invités d’honneur cette année était l’Inde, vaste marché de distribution de la 5G par Huawei.


Entrée de la Big Data Expo Guiyang

Les conférences affichent représentants du gouvernement chinois et entreprises travaillant sur l’IA, de Miao Wei, ministre de l'Industrie et des Technologies de l'information, à Paul Romer, prix Nobel d'économie et professeur à l'Université de New York, en passant par Kevin Kelly, rédacteur en chef et fondateur du magazine Wired, et Lu Yong, vice-président de Huawei. Ce dernier affirme que "la 5G n'est pas seulement une 4G plus rapide. Elle va modifier fondamentalement la façon dont les entreprises mènent leurs affaires et restructurer un large éventail d'industries en utilisant des données pour créer davantage de valeur".

Baidu y parle d’un "Internet of everything", la combinaison de l’IoT+AI+5G. Egalement au programme : l’IA comme nouveau pouvoir de la société, avec quelques notions de protection de données évoquées par le président d’Huawei Cloud et une forte implication écologique, ou encore des voitures autonomes (qui n’arriveraient pas avant 15 ans selon le Dr. Guobin Wu du AI Lab de Didi), avec un programme pilote qui court depuis 2016, une avancée importante, surtout "pour les femmes", un genre d’allusion que l’on a le droit de faire en Chine. Kevin Kelly évoque des méga-ordinateurs constitués des puces de nos appareils connectés et l’importance du "edge computing", tout en soulignant que le "Big Data without big AI is a big headache".

La partie exposition accueille, entre autres, Huawei, Alibaba, Dell, Tencent, CCTV, voitures autonomes de HanKaiSi, et même Google, mais pas dans sa fonction de moteur de recherche. Google présente la section Asie de Google Arts & Culture et des ombres chinoises générant des vidéos d’animation.  


Les ombres chinoises chez Google 

Un forum franco-chinois pour la coopération dans l'IA

2019 est l’année du 55ème anniversaire de la collaboration franco-chinoise et c'est aussi la première participation de la France à la Big Data Expo dans le cadre d'un forum franco-chinois. Airbus et Dassault y présentent le transport de demain, l’entreprise Yidu Cloud démontre les possibilités de la médecine augmentée par l’IA - notamment dans la recherche du cancer -, et Lu Qingjun, directeur du Centre national de télémédecine et de médecine Internet, propose d'établir une norme internationale des données de santé pour coopérer dans la prévention et le contrôle des principales maladies.

A l’initiative du Hub France IA, sous le haut patronat de Cedric O, Secrétaire d’Etat chargé du Numérique, et avec la Guiyang Big Data Development Administration, soutenue par le gouvernement chinois, a été signé un protocole d’accord sur une coopération autour de la data. Antoine Couret, président du Hub France IA, souligne, comme le président chinois, l’importance de la collaboration internationale pour l'avenir de l’IA.


Signature d'un protocole d'accord sur la collaboration autour des données, entre le Hub IA France et la Guiyang Big Data Development Administration 

Une plateforme d’échange de données entre la France et la Chine pourra aider à faire progresser les travaux d’analyse de données dans des secteurs stratégiques comme la Santé et le Transport. Les échanges d’étudiants entre les deux pays et la mise en place de projets de recherche communs (à l’instar du MIT CHIEF) sont un autre enjeu pour faire émerger des talents en ingénierie de la donnée, suggère par Françoise Soulié, professeure en informatique qui vient d'enseigner pendant trois ans l'Intelligence Artificielle à l'Université chinoise de Tianjin.

Hangzhou, rencontre d'Histoire et de High Tech sur fond de Edge computing

Après trois jours à Guiyang, la prochaine étape de notre voyage est Hangzhou dans la province de Zhejiang. Région d’origine du célèbre thé Long Jing, résidence des Empereurs chinois au bord du lac de l’Ouest, considérée comme l’une des plus belles villes de Chine, Hangzhou est également la ville natale du fondateur d’Alibaba et le siège du géant d'e-commerce. C’est d’ailleurs Alibaba qui optimise le trafic local sur les routes en analysant des informations issues de drones, alarmes, caméras, smartphones et voitures connectées.

Au carrefour entre traditions et high tech, c’est à Hangzhou que l’on retrouve l’une des entreprises qui nous accompagne depuis l’aéroport aux conférences de la Big Data Expo, en passant par l’entrée de l’hôtel et chaque arrêt au feu : HIK Vision, numéro un de la surveillance vidéo, sur la liste noire de Trump. Comme pour la plupart des entreprises en secteur stratégique, 51% de HIK Vision sont détenus par l’Etat chinois. 13 000 ingénieurs R&D travaillent à l’amélioration de la détection d’image, jusqu’à l’identification d’une personne par sa façon de bouger.

Des caméras pour gérer les stocks de magasins, optimiser le trafic, surveiller des prisons (comme celle de Lille en France) ou encore, dissimulés dans un ours en peluche, pour garder les enfants à la maison. On retrouve ici la tendance du passage du Cloud au Edge computing déjà évoquée à la Big Data Expo, et à l’intégration de l’intelligence directement dans le terminal pour se passer des latences de la connexion à distance. Avec un enjeu important pour toutes les industries similaires en Chine : s’affranchir de la dépendance des puces américaines pour créer une "AI on chip" made in China.

C’est justement le challenge de Robsense, fabricant de drones pour des vols en formation. Situé dans le plus grand bâtiment du monde (encore une histoire d’échelle) dans la HighTech Zone “5050plan” de Hangzhou, qui héberge un centre de recherche en IoT, l’équipe de jeunes chercheurs de Robsense travaille sur un contrôle intelligent des drones, tout en mettant à disposition leur code en Open Source.


Dans les bureaux de Robsense

Une innovation avec des données de l'utilisateur pour utilisateur

Dernière étape de notre voyage : Pékin. C'est dans la capitale chinoise que se concentre près de la moitié des licornes, dont Didi, l'Uber chinois. L’un des points forts de l’innovation en Chine est sa grande sensibilité à l’expérience utilisateur. Des applications parfaitement ergonomiques (et addictives) qui permettent de passer sa vie avec les BATX et leurs écosystèmes de services (copiés par les GAFA), en répondant à chaque besoin du quotidien. Combiné à des utilisateurs très connectés, peu frileux de nouvelles technologies et nouveaux usages (comme partout en Asie), elles sont la clé du succès de la stratégie Big Data chinoise. 

Achats groupés sur Meituan, e-commerce sur Pinduoduo, cadeaux virtuels sur des plateformes de streaming, shortvideos sur Kuaishou (l’appli à succès de la Big Data Expo, soutenue par Tencent et concurrent de TikTok), binge-watching sur iQiyi, le Netflix chinois du contenu, dialogue avec les assistant vocaux Baidu, discussions sur Blued, premier réseau social homosexuel chinois, retouches de photos sur Meitu (avec la techno Face++ et Face ID de Megvii), partage d’expériences tendance sur Xiaohongshu (Le petit livre rouge), commerce phygital dans les magasins digitalisés par Alibaba (avec Auchan et Taobao) ou encore cabines de karaoké dans les aéroports, la récolte des données se fait de façon ludique jusqu’au "Smile to pay" avec Ant Financial


Xiaohongshu à la Big Data Expo

Les utilisateurs chinois trouvent l'offre proposée en retour assez intéressante pour adhérer à la collecte des données. Ant Financial, la filiale financière d’Alibaba, met à disposition une "Digital fintech for all", avec par exemple, un service de micro-crédits facilement débloquables grâce aux données utilisateurs disponibles (3 secondes au lieu de 2 mois d’attente), et une protection contre les escroqueries basée sur la blockchain Open Ant BaaS. Le "New Retail" prôné par Jack Ma porte ses fruits auprès de 80 millions de commerces jusqu'au petit vendeur de rue.

La recommandation intelligente chez ByteDance

Le succès de ByteDance se fonde notamment sur une recommandation personnalisée plus efficace que celle de Facebook, développée dans son laboratoire IA. 

En sept ans, ByteDance est devenue la start-up la mieux valorisée du monde (75 milliards de dollars). Lancée dans un petit local près de l’Université de Beijing, le nombre d'employés de l'entreprise ne cesse d'augmenter depuis sa fondation, proportionnellement à son expansion mondiale, avec une présence, à ce jour, dans 150 pays et 75 langues. Une partie importante des employés est notamment chargée de contrôler les vidéos, après un rappel à l’ordre par le gouvernement chinois pour diffusion de "contenus vulgaires".

Son produit le plus connu à l’international est l’application de vidéos courtes TikTok, qui est en train de faire de l’ombre aux autres réseaux sociaux installés à l’Ouest, surtout auprès d’un public féminin (très) jeune. En France, plus de la moitié des jeunes filles de 11 à 14 ans l'utiliseraient (selon Génération Numérique).

La Chine a sa propre version de l'application TikTok, Douyin, avec une exigence différente en rapport aux "valeurs centrales du socialisme". A l’image d’autres réseaux sociaux, la plateforme ne cesse de s’enrichir de nouvelles expériences, à coups de live streaming, e-commerce et partage d'expérience voyage avec #TiKToKTravel. Le modèle de succès est le même que dans l’autre application phare de ByteDance, Jinri Toutiao ("À la Une aujourd'hui"), qui propose grâce à un apprentissage automatique continu basé sur les GAN (Generative Adversarial Network), des contenus qui correspondent à des centres d'intérêt et des habitudes, avec un succès fulgurant. Elle affiche un temps passé dans l’application de 74 minutes par jour (+50% par rapport à Facebook, et +12% même par rapport à WeChat).


Le siège de ByteDance, dans un ancien musée de l'aéronautique à Pékin

Big Data en Chine, une gouvernance à double tranchant

Hôtels Alibaba, hôpitaux Tencent, services publics via WeChat (qui est en fait devenu synonyme de smartphone) - les liens étroits entre entreprises et plateformes dans des domaines stratégiques du Big Data et le gouvernement chinois ne sont pas un secret. La loi interdit aux banques d’être hébergées sur des clouds privés, les données des Chinois n’ont pas le droit de sortir du territoire, les informations pour la reconnaissance faciale utilisés dans AliPay proviennent du système national de sécurité, Zhima Credit d’Ant Financial est partenaire technologique du programme national de "Crédit social", et en février 2019, la structure gouvernementale responsable de la planification en Chine a inauguré un laboratoire d’IA en partenariat avec Baidu.

Le système du “Crédit social” basé sur la collecte d'informations sur les réseaux sociaux et via 170 millions de caméras de surveillance intelligentes serait en effet impossible sans la coopération des BATX. Une imbrication qui peut paraître redoutable du point de vue d’une démocratie occidentale, mais qui est très bénéfique pour l’entraînement de l’intelligence artificielle, là où l’Europe s’auto-censure avec le RGPD et où les Etats-Unis se lancent dans des discussions anti-trust.

Mais tout comme l’Europe, la Chine prône une "AI for good" pour relever les défis sociétaux : exode rural, réduction de la pauvreté (avec succès), pollution, pluralité sociale, déserts médicaux… Un écosystème très bien décrit dans le rapport d’Aifang Ma L’Intelligence Artificielle en Chine : un état des lieux


Collaboration entre plateformes et gouvernement chinois, source : Mary Meeker, Internet Trends 2019

Les données sont une valeur marchande et un outil nécessaire aux scientifiques pour entraîner les algorithmes. C’est notamment dans cet objectif que la France vient de signer l’accord de principe avec la Chine, un pays au premier plan mondial en termes de ressources numériques disponibles, pour avancer dans la recherche sur l' IA et l’analyse de l’échange de données. Tout en maintenant une IA éthique, mais en passant désormais à l’étape opérationnelle, l’Europe peut, dans certains domaines, se permettre une ouverture vers des partenaires puissants, et en même temps travailler sur la mise en place d’un écosystème indépendant basé sur la collaboration entre pays membres, dans l'objectif de la création d'une véritable plateforme européenne de données.   


Salle de réunion chez nihub, Centre d'innovation basé à Hangzhou, qui aide les entreprises internationales dans leur approche du marché chinois

* Un grand merci à Xu Bo, représentant de la Big Data Expo en France
Photos : KB, sauf image de couverture, Shanghai, par Li Yang sur Unsplash

A voir : Une animation sur le site d'Abacus qui dessine l'écosystème tech chinois