Considéré comme la dernière étape de la troisième révolution industrielle, le Big Data est d’une importance déterminante dans le monde d’aujourd’hui. Cependant, il peut paraître nébuleux aux néophytes. Dire que le big data est seulement l’ensemble des données générées par Internet et gérées par des entreprises ne suffit pas. Allons un peu plus loin dans la définition et la compréhension du big data.
Par définition, le big data est un « domaine technologique dédié à l’analyse de très grands volumes de données informatiques ». Nous pouvons ajouter que ces données collectées se mesurent en zettaoctets : en 2020, 64 zettaoctets (soit 64 milliards de téraoctets) ont été générés et un volume de 180 zettaoctets est déjà prévu à l’horizon de 2025. Ce massif amas d’information est issu de tous les logiciels, applications et objets connectés à l’Internet. Le terme français officiellement recommandé est mégadonnées.
Plus prosaïquement, le big data est l’ensemble des données inhérentes aux utilisations d’Internet : recherches, visionnage de vidéos, posts sur les réseaux sociaux, achats en ligne, utilisations des appareils connectés comme les box et les montres connectées, données GPS, etc. Ces données sont en très grande partie stockées dans des Data Center disséminés un peu partout dans le monde. Et ce sont essentiellement les grands noms du Web et de l’informatique qui génèrent, détiennent et gèrent les mégadonnées.
Le big data étant un phénomène de très grande envergure, il est complexe et prend plusieurs formes. La définition précise du big data peut alors varier selon les communautés qui s’y intéressent.
Nous pouvons citer une autre définition du big data qui fait référence depuis 2001, celle de Gartner, une entreprise américaine réputée dans le conseil et la recherche en techniques avancées. Elle stipule que les mégadonnées (big data) sont des ressources d’information à volume élevé, à grande vitesse et à grande variété. C’est ce qu’on appelle les 3 V du big data :
À ces 3 V se sont ajoutées deux autres dimensions : la valeur et la véracité. Chaque donnée possède sa valeur, laquelle peut varier en fonction de l’utilité découverte. De plus en plus d’entreprises suivent l’exemple des grands ténors du Web en gagnant de l’argent grâce aux données collectées. Et la valeur de celles-ci dépend directement de leur véracité, de leur fiabilité.
L’Internet des objets, ou IoT, est l’ensemble des objets et technologies connectés à Internet et utilisant ce réseau de communication, et d’autres, pour transférer des données. Tous les objets disposant d’un capteur et d’une cellule de communication sont concernés. Leur rôle dans le big data est majeur, et la prolifération de ces dispositifs connectés à Internet est exponentielle : environ 10 milliards d’appareils connectés en 2020 et la plupart des analytes estime le chiffre à plus de 50 milliards pour 2025.
Les objets connectés génèrent donc des données d’utilisation qui s’ajoutent aux autres sources de données traditionnelles telles que les achats en ligne.
L’accroissement exponentiel des mégadonnées est aussi exacerbé par l’utilisation du cloud computing. Cette technologie du big data permet aux entreprises de stocker et de gérer leurs données sur des installations externes. Ce type d’utilisation de l’informatique soulage les entreprises qui n’investissent pas dans du matériel onéreux à acheter et entretenir.
Dans ce domaine, consultez les offres d’Orange Business Services
Retrouvez Orange Business Services aussi dans ce rôle.
Découvrez également :