De visualisatie die we in deze blog beschrijven verscheen al eind december online. We wilden het stuk al eerder met jullie delen, maar door drukte kwam het er niet van. Het resultaat is echter zo indrukwekkend dat we hem jullie niet willen onthouden. The New York Times heeft namelijk op een zeer krachtige wijze inzichtelijk gemaakt wat je allemaal kunt bereiken op basis van (anonieme) locatiedata.
The New York Times kreeg een dataset in handen met daarin meer dan 50 miljard datapunten (met locatiedata) van meer dan 12 miljoen Amerikanen. Deze datapunten zijn verzameld over een periode van meerdere maanden in 2016 en 2017. Wanneer je er vanuit gaat dat van ieder individu evenveel datapunten aanwezig zijn komt dit naar op ruim 4.000 datapunten per persoon. Uit het artikel is niet te herleiden over welke periode de data is verzameld. Wanneer we aannemen dat dit over een half jaar tijd is kom je op ongeveer 23 datapunten per dag, of te wel één datapunt per uur. Dit geeft een goed beeld van iemands leefpatroon als het gaat om locaties van werk, wonen, sporten, etc.
Dit is ook één van de conclusie die The New York Times trok uit de data. Zo nemen ze één individu uit de data die ze hadden gevonden in Central Park. Van dit individu hebben ze alle data op een kaart geplot en de verschillende punten door de tijd heen met elkaar verbonden. Dit geeft een uitstekend beeld van iemand persoonlijke leven, alsof het een dagboek betreft:
Aan het begin van deze blog rekende we uit dat er van ongeveer ieder uur een datapunt beschikbaar is. Uit de werkelijke data valt echter een ander verhaal te herleiden. Hoewel niet bekend is waar de data vandaan komt, wordt wel gemeld dat het geen data van de overheid of een telecomprovider betreft. Het is dus aannemelijk dat de data is verzameld door een applicatie op de mobiele telefoon, zoals bijvoorbeeld Foursquare.
Dit soort diensten verzamelen voornamelijk data wanneer je hun app open hebt staan op je mobiel. Je kunt dan ook aannemen dat er overdag meer data wordt verzameld dan s’nachts. Dit komt goed naar voren uit het voorbeeld dat ze pakken van een senior medewerker van defensie. Van deze persoon is precies te zien welke route hij aflegt door Washington op een specifieke middag.
Omdat bij het verzamelen van de data niet wordt gekeken naar de mogelijke gevoeligheid is het interessant om in te zoomen op belangrijke locaties zoals Het Witte Huis, het Pentagon en het Capitool. Deze informatie kan gebruikt worden om advocaten, militairen en politieagenten te identificeren. Met informatie van een individu kun je vervolgens erachter komen waar deze persoon woont, zijn kinderen naar school gaan, etc.
Deze impact is ook het verhaal dat The New York Times wil vertellen met het artikel. Ze hadden dit kunnen doen door enkel te beschrijven welke conclusies ze konden trekken uit de data. Het verhaal was hiermee lang niet zo krachtig geworden. Door de punten op een kaart te tonen worden het personen en komt het verhaal, en de personen, tot leven.
Aanvullend kun je ook stellen dat deze uitwerking een goed voorbeeld is van nieuwe media. Wanneer dit artikel was verschenen in een traditionele krant, voorzien van bijvoorbeeld de afbeeldingen uit deze blog, komt het verhaal lang niet zo goed uit de verf. Houd het dus ook niet bij het lezen van de blog en duik zelf verder in het verhaal!
Ben je enthousiast over de blogs van Datadump en wil je eenvoudig op de hoogte worden gehouden over de laatste ontwikkelingen? Volg ons dan via Twitter, LinkedIn, RSS, schrijf je in voor één van onze nieuwsbrieven, of voeg onze auteurs Joost en Dennis toe aan je netwerk.
pyaovp
leg9fd
uvxy0i
qezrvc
a2k5yq