Tous ensemble, nous créons plus de données que jamais auparavant. Essayez par exemple d'imaginer combien de données vous créez dans votre vie quotidienne, en dehors de votre travail : des messages sur les réseaux sociaux, aux visites chez le médecin, en passant par les listes de musique sur Spotify et les appels téléphoniques à votre fournisseur d'énergie. Combinez cela avec toutes les données de toutes les personnes, entreprises et autres organisations aux quatre coins du monde et vous aurez le vertige.
Afin de mieux comprendre le Big Data, IBM a inventé le système des quatre V. Ils représentent les quatre dimensions du Big Data : Volume, Vélocité, Variété et Véracité. Dans cet article, nous allons aborder en détail ces quatre dimensions. Qu'impliquent-elles et que signifient-elles dans notre vie de tous les jours et dans celle de l'entreprise ?
Volume
Le fait que le Big Data représente un volume important de données n'a naturellement rien d'étonnant. L'on estime que nous créons chaque jour 2,4 trillions de gigabits de données. Et ce ne sont que des mots en plus. Ce constat est naturellement lié au gigantesque réseau de téléphonie mobile. Pour vous donner une idée : six des sept milliards de la population mondiale ont actuellement un téléphone portable. Les messages SMS et WhatsApp, les photos, les vidéos et les nombreuses applications contribuent à faire augmenter significativement le Big Data.
Une telle croissance du volume de données entraîne également une augmentation des besoins en nouveaux systèmes de gestion de bases de données et en personnel IT. L'on s'attend à ce que d'ici deux ans, des millions de nouveaux emplois vont se créer dans le secteur de l'IT afin de faire face au flux de Big Data.
Vélocité
La vélocité, ou vitesse, fait référence à l'énorme rapidité avec laquelle les données sont générées et traitées. Jusqu'il y a quelques années, traiter les bonnes données et faire remonter à la surface les bonnes informations prenait beaucoup de temps. Aujourd'hui, les données sont disponibles en temps réel. Cela ne s'explique pas uniquement par la vitesse de l'Internet, mais aussi par la présence du Big Data. Plus nous créons des données, plus il nous faut de méthodes pour les analyser, ce qui augmente parallèlement le nombre de données à observer. C'est un cercle vicieux.
Variété
La vitesse élevée et le volume important vont de pair avec la diversité de forme des données. En effet, les solutions IT intelligentes sont aujourd'hui disponibles pour tous les secteurs, du milieu médical au milieu de la construction en passant par celui de l'entreprise. Songez par exemple aux dossiers médicaux électroniques dans le domaine des soins de santé, qui représentent plusieurs milliards de gigabits de données. Et nous ne parlons pas encore des vidéos que nous regardons sur YouTube, des messages que nous postons sur Facebook et des articles de blog que nous écrivons. Lorsque, dans le futur, toutes les parties du monde auront accès à l'Internet, la quantité et la variété des données ne feront qu'augmenter encore.
Véracité
L'authenticité du Big Data reste un obstacle. Les données sont rapidement obsolètes et de nombreuses informations qui sont partagées via l'Internet et les réseaux sociaux ne sont pas forcément correctes. Ainsi, de nombreux responsables et directeurs d’entreprise n'osent pas prendre de décision sur la base du Big Data.
Organiser et valoriser les données adéquates donnent aux scientifiques de données et aux spécialistes ICT énormément de travail. Il est très important qu'ils trouvent ici leurs repères. Lorsque le Big Data est utilisé et organisé comme il se doit, il peut se révéler très précieux dans notre vie. De la prédiction de tendances commerciales à la prévention de maladies et de la criminalité.
Utilisez-vous le Big Data au sein de votre organisation ? Le cas échéant, comment vous servez-vous de ces quatre dimensions ?
Pour en savoir plus :
Source d’image : AdobeStock © Gorodenkoff 200146313