Wikileaks maakte datajournalistiek tot een buzz-woord. Moesten we dat niet allemaal gaan doen? Maar data verwerken om nieuws te maken is al eeuwenoud. De Angelsaksische landen kunnen bijvoorbeeld bogen op een rijke traditie. In deze eerste aflevering: het ontstaan van datajournalistiek in vogelvlucht.

Pas na een vacature bij NU.nl begin 2011 werd journalistiek Nederland nieuwsgierig: datajournalistiek, wat is dat eigenlijk? Jelle Kamsma kreeg de baan van full-time datajournalist bij de grootste nieuwssite van ons land en mocht in Nederland doen wat voorgangers bij onder meer de New York Times en The Guardian al jarenlang deden: op zoek naar nieuws door enorme databestanden te analyseren en visualiseren.

Data verwerken om nieuws te maken is echter al eeuwenoud. Florence Nightingale toonde tijdens de Krimoorlog (1853-1856) al aan dat je met cijfers, statistieken en visualisaties de maatschappij kunt veranderen. De Britse arts bewees met haar visualisaties dat het merendeel van de soldaten niet door oorlogshandelingen, maar door de slechte hygiënische omstandigheden om het leven kwam.

John Snow en de cholerakaart
Een andere anekdote waar datajournalisten graag naar teruggrijpen om aan te tonen dat hun beroep al eeuwenoud is: de cholerakaart van John Snow. De Britse dokter leefde in het Londen van 1854, toen de stad kreunde onder een cholera-epidemie. De destijds gangbare theorie voor het verspreiden van de bacterie: door de lucht. Dokter Snow twijfelde daar aan. Hij vermoedde dat de ziekte zich via het water verspreidde.

Snow turfde alle choleradoden in de wijk Soho op een kaart, zag dat veel mensen in de buurt van een waterpomp stierven en liet een aantal statistische berekeningen op zijn gegevens los. Hij vond een verband tussen de bron van het water – een plek in de Theems waar ook rioolwater stroomde – en de plekken waar dat water via waterpompen werd aangeboden. Nog voordat het wetenschappelijke onderzoek van Snow was afgerond, werden de waterpompen afgesloten en daalde het aantal cholerapatiënten.

[Peter Burger wijst er in een reactie onder dit artikel op dat het verhaal van Snow vermoedelijk een mythe is.]

Deze twee voorbeelden zijn – niet vreemd – afkomstig uit de gezondheidszorg, een vakgebied waarin bewijs door statistische methoden en een directe invloed op de kwaliteit van het leven bovenaan staan.

Meer data, meer processorkracht
Ruim dertig jaar daarvoor publiceerde de Britse krant The Guardian een artikel dat gebaseerd was op data. Op de voorpagina van de allereerste editie van de Britse krant stond een lijst met scholen in Manchester en Salford. De tabel gaf aan hoeveel scholieren elke school had en hoeveel kinderen gratis onderwijs kregen. Enkel arme kinderen kregen gratis onderwijs.

Officiële schattingen meldden dat zo’n achtduizend kinderen gratis naar school mochten. Echter, volgens de gelekte lijst die in The Guardian werd gepubliceerd, ging het om een aantal van 25.000 kinderen. Kortom, het aantal arme kinderen in deze Engelse steden werd schromelijk onderschat.

De Britse datajournalist Simon Rogers van The Guardian beschrijft bovenstaande in zijn boek Facts Are Sacred: The Power of Data. Hoewel het publiceren van een tabel tegenwoordig geen datajournalistiek zou worden genoemd, ziet hij wel een gelijkenis met de motivatie die erachter schuilgaat.

In other words, without knowing the state of society, how can things ever get any better? This was using data to help fight for a decent education system. The tools we have to analyse the data may have changed; that motivation has stayed exactly the same.

De gereedschappen veranderden inderdaad met de komst van de computer. De Amerikaan Philip Meyer beschreef in 1967 voor de Detroit Free Press de rassenrellen in Detroit door enquetes te verzamelen en analyseren. De journalist en socioloog Meyer had op Harvard leren programmeren, dus hij verwerkte de enorme bak met data met wetenschappelijke precisie en de destijds beschikbare processorkracht.

Meyer noemde deze vorm van journalistiek Computer-Assisted Reporting, kort gezegd CAR. In 1969 bracht hij het boek Precision Journalism uit, waarin hij pleitte voor meer sociaal-wetenschappelijke onderzoeksmethodes en het gebruik van databases in de journalistiek.

De grote omslag: Wikileaks
De opkomst van CAR betekende echter niet dat kranten gericht op zoek gingen naar datajournalisten. De grote omslag voor datajournalistiek kwam in 2010, toen Wikileaks de wereld wakker schudde met het vrijgeven van tienduizenden bestanden. De oorlog in Afghanistan en Irak leverde respectievelijk 92.201 en 391.832 documenten op.

Later dat jaar betrok de klokkenluiderswebsite The Guardian, The New York Times, Der Spiegel, Le Monde en El País bij de zogeheten Cablegate: ruim 250.000 uitgelekte correspondenties vanuit de Amerikaanse ambassade.

De traditionele journalist kon niet meer volstaan met het uitprinten en doorlezen van al deze documenten. Datajournalisten kregen een onderzoek in hun schoot geworpen van internationaal belang, maar moesten noodgedwongen op zoek naar slimme methodes om deze hoeveelheid aan data te doorzoeken en analyseren.

Sindsdien is bijvoorbeeld The Guardian een prominente voorvechter van datajournalistiek. Op hun Datablog en Datastore wordt sinds 10 maart 2009 openbare informatie aangeboden, geanalyseerd en geduid. Het recentste wapenfeit van The Guardian is de analyse van de rellen in Londen en Tottenham van 6 tot en met 10 augustus 2011. De Britse krant verzamelde naar voorbeeld van Philip Meyer data om de sociologische achtergrond van de rellen te analyseren.

The Guardian deed dat echter niet met enquêtes, maar door het Twitter-verkeer voor, tijdens en na de rellen te analyseren. In tegenstelling tot wat enkele Britse politici beweerden, bleek er weldegelijk een verband te zijn tussen armoede en de locatie waar relschoppers vandaan kwamen. Ook bleek een dreigend Twitter-verbod nergens op gebaseerd te zijn. De meeste tweets van relschoppers werden pas na de rellen verstuurd.

De Angelsaksische landen kunnen bogen op een rijke traditie van datajournalistiek. In Nederland is die traditie net een jaar oud, met daaraan voorafgaand een aantal incidentele projecten.

In deel 2 van deze serie: De opkomst van datajournalistiek in Nederland.

_____

Deze serie is  tot stand gekomen in samenwerking met het Mediafonds en Persinnovatie.nl.  De serie is een bewerking van een artikel over datajournalistiek in 609, het magazine van het Mediafonds. De andere delen in deze serie zijn hier te vinden.

Jerry Vermanen

Redacteur

Jerry Vermanen werkt als datajournalist bij Pointer (KRO-NCRV).
Profiel-pagina
Al 2 reacties — discussieer mee!