Met z'n allen creëren we meer data dan ooit tevoren. Denk alleen al aan de hoeveel data die je creëert in je dagelijks leven, nog los van je werk! Van berichtjes op social media tot bezoekjes aan de dokter, muzieklijsten op Spotify en telefoontjes aan de energiemaatschappij. Combineer dat met alle data van andere mensen en organisaties over de hele wereld en het gaat je duizelen.
Om meer inzicht te krijgen in Big Data, bedacht IBM het systeem van de vier V’s. Deze V’s staan voor de vier dimensies van Big Data: Volume, Velocity, Variety en Veracity. In dit artikel gaan we dieper in op deze dimensies. Want wat houden ze precies in en wat betekenen ze voor ons dagelijks leven en het bedrijfsleven?
Volume
Dat Big Data groot is in volume, is niet zo verrassend. Naar schatting creëren we dagelijks 2,3 triljoen gigabytes aan data. En dat gaat alleen maar meer worden. Deze toename wordt natuurlijk mede veroorzaakt door het gigantische mobiele telefonie netwerk. Om je een idee te geven: zes van de zeven biljoen mensen in de wereld heeft inmiddels een mobiele telefoon. Sms- en whatsappberichten, foto’s, video’s en vele apps zorgen ervoor dat de hoeveelheid aan data aanzienlijk toeneemt.
Doordat het volume zo snel groeit, groeit ook de behoefte aan nieuwe database managementsystemen en werknemers in de IT. De verwachting is dat er in de komende paar jaar miljoenen nieuwe IT-banen bijkomen om de Big Data stroom op te vangen.
Velocity
Velocity, ofwel snelheid, duidt op de enorme snelheid waarmee data wordt gegenereerd en verwerkt. Tot enkele jaren geleden duurde het even om de juiste data te verwerken en de juiste informatie boven water te krijgen. Tegenwoordig zijn data real-time beschikbaar. Dit is niet alleen een gevolg van de snelheid van het internet, maar ook van de aanwezigheid van Big Data zelf. Want hoe meer data we creëren, hoe meer methodes nodig zijn om al deze data te monitoren, en hoe meer data worden gemonitord. Er ontstaat zo een vicieuze cirkel.
Variety
De grote snelheid en het aanzienlijke volume hangen samen met de verscheidenheid aan vormen van data. Slimme IT-oplossingen zijn vandaag de dag immers beschikbaar voor alle sectoren, van de medische wereld tot de bouw en het bedrijfsleven. Denk bijvoorbeeld aan de elektronische patiëntendossiers in de zorg, die bijdragen aan vele biljoenen gigabytes aan data. En dan praten we nog niet eens over de video’s die we kijken via Youtube, de berichten die we delen via Facebook en de blogartikelen die we schrijven. Wanneer alle delen van de wereld in de toekomst beschikken over het internet, zullen het volume en de variëteit alleen maar toenemen.
Veracity
Hoe waarheidsgetrouw Big Data is, blijft een lastig punt. Data veroudert snel en de informatie die via het internet en social media wordt gedeeld, hoeft niet per se juist te zijn. Veel managers en directeuren in het bedrijfsleven durven dan ook geen beslissingen te nemen op basis van Big Data.
Datawetenschappers en IT-ers hebben hun handen vol aan het organiseren en ontsluiten van de juiste gegevens. Het is van groot belang dat zij hier een goede weg in vinden. Want als Big Data op een goede manier wordt georganiseerd en gebruikt, kan het van grote waarde zijn in ons leven. Van het voorspellen van zakelijke trends tot het voorkomen van ziektes en criminaliteit.