Le Big Data, c’est quoi ?

Le Big Data soulève la question de la récupération des données personnelles par les entreprises de tous les secteurs. En effet, la mise en vente des bracelets connectés, comme le Microsoft Band qui est déjà en rupture de stock, ou les applications de suivi de santé, comme le tout nouveau HealthKit de l’iOS 8 d’Apple permettent aux utilisateurs de classer toutes sortes de données. C’est également sans compter les réseaux sociaux, sur lesquels on tend de plus en plus à diffuser volontairement des informations sur notre vie privée, notre style de vie, nos goûts… Pour en savoir plus sur le Big Data, vous pouvez regarder la vidéo de Data Gueule ou bien lire sa transcription ci-dessous :

Si c’est gratuit, c’est que vous êtes le produit

Ah, les données personnelles… Elles volent partout, tout autour de nous : notre position GPS, les calories perdues pour aller jusqu’au bureau, les heures de sommeil accumulées, le détail de vos virées en vélo, ou en taxi, jusqu’à votre carte grise. Une mine d’informations. Tous ces chiffres, une fois bien récupérés et bien stockés, c’est ce qu’on appelle : le Big Data.

Ces données, nous en sommes les principaux émetteurs, volontairement. Elles documentent de plus en plus chacune de nos activités, et ce n’est qu’un début. En 2015, il devrait y avoir 15 milliards d’appareils connectés à Internet, et jusqu’à 50 milliards en 2020 : autant de sources pour alimenter le Big Data. IBM, leadeur du secteur, a investi 24 milliards de dollars ces dix dernières années sur la seule analyse des données. Voilà une belle promesse… Mais quel est donc l’enjeu de cette boulimie de données ?

Les systèmes de domotique permettent également de recueillir des données. © Data Gueule

Les systèmes de domotique permettent également de recueillir des données. © Data Gueule

Domotique et santé

Prenons les maisons intelligentes, des habitations dotées de capteurs qui analysent les données de notre quotidien. Allstate, un assureur américain, offre déjà 25% de remise à tous les propriétaires qui en équiperaient leur habitation. Etonnant. Autre secteur : les voitures. Des boîtiers, installés dans les voitures, permettent aux conducteurs de jouer avec leurs propres statistiques. Mais l’assureur, lui, les analyse pour affiner des profils types, les bonus, et les malus, et donc des contrats types. Pourquoi s’en priver ? En France, 70% des automobilistes seraient prêts à équiper leurs voitures de capteurs en échange d’une ristourne sur leur contrat.

Et la santé ? AXA, un assureur français, offre à certains de ses assurés un bracelet connecté. Calories brûlées, rythme cardiaque, oxygène dans le sang, il stocke tout un flot de données passionnantes. Du coup, l’assureur vous récompense s’il détecte un mode de vie sain : jusqu’à 100 euros si vous effectuez plus de dix mille pas par jour. Car un assuré en bonne santé, c’est un assureur comblé…

Crédits et politique

Parlons crédit. Lenddo, basé à Hong-Kong, scrute les flux Twitter et Facebook pour déterminer si ses clients méritent un prêt, ou pas. Kreditech, en Allemagne, fait de même : l’entreprise analyse plus de 15 000 paramètres, depuis votre localisation jusqu’à vos achats en ligne. Ou encore Zestfinance, qui capte plus de 70 000 flux différents pour évaluer le risque lié à ses clients.

Les banques exploitent aussi les données personnelle pour sélectionner leurs clients selon leur potentiel de risque.

Les banques exploitent aussi les données personnelle pour sélectionner leurs clients selon leur potentiel de risque. © Data Gueule

Allons plus loin : puisqu’il y a aussi du risque en politique, le Big Data doit pouvoir aider des élections ! Les équipes de Barack Obama ne s’y sont pas trompé. Les fonds collectés lors de la campagne des démocrates de 2012 ont atteint des records : plus d’un milliard de dollars (!), et près de 70% étaient issus des dons en ligne. Merci les données personnelles… grâce aux informations collectées sur les votants, le staff de l’actuel président américain a pu cibler au mieux les appels au don. De la même manière, ils ont pu analyser les comportements d’électeurs clé : les indécis. En Ohio par exemple, les données de 29 000 votants furent injectées dans une machine qui a reproduit 70 000 fois l’élection suivant différents scénarios. En simulant leurs comportements, les équipes d’Obama ont pu déduire quels arguments sauraient les faire basculer dans leur camp. Au fait ! Rayid Ghani, le scientifique des données pour Obama n’est pas un novice ! Le Big Data lui permettait déjà de maximiser l’efficacité des promotions dans les supermarchés. Il n’y a pas de hasard…

Ces données, que nous libérons gratuitement et volontairement à chaque instant, permettent d’optimiser nos tâches quotidiennes. Mais aussi les contrats d’assurances, les profits bancaires, ou les arguments politiques. En limitant les risques, le Big Data espère rentabiliser le monde. Un monde où ceux qui utilisent ces données décident de ce qui est bon, pour eux-mêmes…

Pour aller plus loin…

Le Big Data correspond plus particulièrement à l’ensemble massif de données disponibles actuellement, et ce depuis l’avènement d’Internet — et pas uniquement les données personnelles, puisqu’on y retrouve également des éléments météorologiques, épidémiologiques ou écologiques. Ces données sont utilisées dans tous les domaines, et on appelle le Big Data de cette manière parce que sa masse spectaculaire a donné lieu, forcément, à de nouvelles technologies pour gérer, stocker, et analyser ces données, dont des algorithmes superpuissants qui trient et classent les informations. Une simple base de données comme on en voyait au début d’Internet est loin d’être suffisante désormais, il faut employer des moyens à la mesure de la tâche.

Pour l’anecdote, on estime que le volume des données stockées pourra s’élever à 40 zettaoctets d’ici 2020, sachant qu’un zettaoctet représente environ mille milliards de mégaoctets. De même, Twitter produit 7 teraoctets de données potentiellement exploitables par jour, tandis que Facebook culmine à 10 teraoctets quotidiens. Des entreprises telles qu’Intel proposent des solutions aux entrepreneurs pour pouvoir exploiter « le Big Data » avec des systèmes informatiques dédiés.

Très utilisées, comme on a pu le voir, en marketing pour cibler les envies et les profils des consommateurs, les données du Big Data sont également exploitées dans d’autres domaines, jusque dans les ressources humaines, mais c’est une pratique qui pour l’instant n’est que très peu développée en France.

2018-12-07T10:37:05+00:00