Big data verandert de toekomst

1 Wist ik al2 Leuk om te weten3 Kan ik echt wat mee4 Interessant voor vakgenoten5 Heeft mij inzicht gegeven Waardeer deze post - klik op de sterren (4 votes, average: 2,75 out of 5)
Laden...
Print Friendly, PDF & Email

Door Sander Lenselink

Gaat big data de toekomst veranderen? Ik ben ervan overtuigd. Waarom dan? De hoeveelheid beschikbare data groeit explosief. Maar dat is niet de reden dat big data in de toekomst bepalend zal zijn. Er zijn een aantal onderliggende ontwikkelingen die zeker zoveel impact hebben. 2LVW - Sander LenselinkAan ‘kale’ data heb je niet veel. Het gaat om inzicht.

Met big data kijk je anders naar de wereld. Een eye opener is het boek ‘Big data’ van Viktor Mayer-Schönberger en Kenneth Cukier. Ik ben ‘Big data’ nu aan het lezen en het bevat zoveel interessante gezichtspunten dat ik ze niet wil vergeten. En waarom dan ook niet op ons blog gezet en ze delen?

Het boek begint met het vogelgriepvirus dat de hele wereld in 2009 in de greep had. Nationale gezondheidsdiensten volgden de verspreiding van dit dodelijke virus nauwgezet. Omdat veel van de informatie handmatig werd verzameld duurde het tot wel twee weken voordat er nieuwe gegevens beschikbaar kwamen. Twee weken is met een dodelijk virus een eeuwigheid. Dat de verwerking van de data zo lang duurde werd door iedereen als normaal ervaren. Of toch niet? Al jaren eerder startte Google een onderzoeksproject of zij sneller en beter kon voorspellen hoe epidimieën zich verspreiding.

20141104_Bigdata_boek1Om kort te gaan kon Google in 2009 detail aangeven waar en wanneer het vogelgriepvirus voor de bevolking echt een bedreiging zou vormen. En dan niet per land maar “gewoon” op plaatsniveau. Daarbij worden miljoenen zoekvragen gekoppeld aan de data van overheden hoe zich eerdere epidimieën verspreidden. Er werd gekeken welke verbanden er tussen de zoekvragen en een veelheid van andere data bestaat. Simpel gezegd komt het erop neer dat als in een bepaald gebied vaak op bepaalde zoekwoorden wordt gezocht er dan daar iets aan de hand moet zijn.

Oorzaken en verbanden

Onderzoekers proberen altijd een verklaring te vinden waarom iets is zoals het is. Bijvoorbeeld, de temperatuur daalt onder nul en het water in de sloten bevriest. Daarvoor kunnen we een natuurkundige verklaring geven. Er is oorzakelijkheid (causaliteit). Met big data ligt dat anders. Er worden verbanden (correlaties) in de data ontdekt maar er is geen idee hoe dat kan. Een vaak aangehaald marketingvoorbeeld is het verband tussen de verkoop van luiers en bier. Toeval? Of het moet zijn dat zowel een pak luiers als een krat bier volumineuze artikelen zijn en daardoor deze combinatie vaker door mannen wordt gekocht. En als ze hiervoor op pad worden gestuurd ze ook maar een kratje bier meenemen.

Steekproef of alle data?

Ook in het geval van de vogelgriep zouden er verbanden zijn die niet uitgelegd kunnen worden. Maar toch hebben die verbanden voorspellende waarde. En dat is essentieel in het begrijpen van de impact van big data. Bij veel onderzoeken wordt gebruik gemaakt van steekproeven. Het is te kostbaar en vaak onmogelijk alles en ieder te ondervragen. Bij een steekproef heb je veel minder data dan er in werkelijkheid is. Omdat je minder data hebt, is de kans dat je betrouwbare verbanden ontdekt veel minder.

20141104_Bigdata_schema1Bij big data verandert de hoeveelheid gegevens. En meer data biedt je meer dan meer gegevens. Met meer data kun je meer ontdekken. Ter vergelijking, een film is meer dan een reeks foto’s. Een film vertelt een verhaal veel intenser en je kunt ook andere aspecten belichten.

Big data gaat ook over voorspellen zoals Google de verspreiding van het vogelgriepvirus wilde voorspellen. Of dat de inhoud van een e-mail spam is. Dat is allemaal gebaseerd op grote hoeveelheden data en kansberekeningen.

Kortom big data gaat over (1) verbanden ontdekken en (2) voorspellen.

Meer, rommelig en goed genoeg

Big data is de aanjager voor economische groei en innovatie. De belangstelling voor big data is de resultante van maatschappelijke ontwikkelingen. Als eerste kunnen we tegenwoordig veel beter grote hoeveelheden data analyseren (1). In sommige gevallen wordt zelfs alle data geanalyseerd die met betrekking tot een onderwerp beschikbaar is. En big data geeft inzicht wat met steekproeven niet mogelijk is. Big data geeft veel meer mogelijkheden om dieper in de data te graven (data mining) en zo subcategorieën en deelmarkten te ontdekken

Het spreekt voor zich dat als je in een spreadsheet een optelling maakt je het precieze antwoord krijgt. Maar we maken ons absoluut niet druk of het bruto nationaal product (BNP) van een land een paar euro afwijkt van de werkelijkheid. Het BNP wordt berekend op basis van vele bronnen. Al die bronnen bevatten fouten en onvolkomenheden en daarom is honderd procent precisie een illusie. Zo is het ook met big data. We accepteren dat fouten en dat de dataset rommelig kan zijn (2).

2LVW Big data - Kenneth Cukier

Co-auteur Kenneth Cukier van ‘Big data’ over over big data

Mensen weten graag de oorzaak van iets. Bij big data laten we dat los. In plaats van causaliteit (oorzakelijkheid) gaat het ons om patronen en correlaties in de data te ontdekken (3). Correlaties vertellen ons niet het waarom maar wel het wat. Er wordt wel gezegd “laat de data voor zich spreken” en waarmee wordt bedoeld dat we wel de verbanden willen weten (wat) maar het waarom voor lief laten.

Samenvattend zijn kenmerken van big data dat je beschikt over veel gegevens, de data soms rommelig is en zeker niet honderd procent precies. En dat is het juist klimaat om nieuwe inzichten te verkrijgen.

Dataficatie

Big data gaat de toekomst veranderen. Er komt steeds meer data ter beschikking. Er wordt gesproken over ‘The internet of things’ waarmee wordt aangegeven dat ‘dingen’ zoals koelkasten, thermostaten of een locatie waar je je bevindt data vertegenwoordigen en daarvan al veel wordt vastgelegd. Als deze gegevens hebben een ‘value’, zeker als ze worden ontsloten. En daarmee zou je kunnen voorspellen wanneer je CV-kachel onderhoud nodig heeft of de motor van de koelkast defect gaat. Kortom, nu al is dataficiatie realiteit.

 

 

 

1 Wist ik al2 Leuk om te weten3 Kan ik echt wat mee4 Interessant voor vakgenoten5 Heeft mij inzicht gegeven Waardeer deze post - klik op de sterren (4 votes, average: 2,75 out of 5)
Laden...

Nog geen reacties.

Geef een reactie

2LVW online marketing & business analytics