De macht van het getal. Dat is dit jaar het thema van het elfde VVOJ Congres in Zwolle. Twee dagen lang komen driehonderd onderzoeksjournalisten uit Nederland en België bij elkaar om van elkaar te leren. Jerry Vermanen en Ruby van der Meijden doen verslag van enkele workshops en sessies.

Bij een groot journalistiek verhaal weet je meestal wel waar je informatie vandaan kunt halen. Soms zijn er zelfs spreadsheets beschikbaar waar je data-analyse op kunt uitvoeren. Maar hoe kun je datajournalistiek doen als er geen data beschikbaar zijn?

Jennifer Lafleur geeft een aantal tips hoe je je eigen databases kunt opbouwen. ‘Datajournalistiek zonder data.’

‘Kijk altijd of iemand een database heeft opgebouwd voordat je het zelf doet’, drukt Lafleur op het hart. ‘Het scheelt enorm veel werk voordat je besluit om jouw eigen database te maken.’ Maar wat moet je doen als er alleen PDF-documenten beschikbaar zijn? Of als jouw onderwerp niet in documenten wordt bijgehouden.

Willekeurige selectie

Als voorbeeld neemt Lafleur een verhaal dat zij voor Propublica maakte over de voorkeur bij presidentiële pardons voor gevangen. Blanke criminelen hadden een vier maal hogere kans om een pardon te ontvangen ten opzichte van hun zwarte lotgenoten.

Om dit verhaal te maken, analyseerde Lafleur niet alle pardons, maar een willekeurige selectie daarvan. Omdat dit een willekeurige selectie is, is het bij een groot genoeg sample representatief voor alle documenten.

Alsnog kreeg Propublica forse kritiek van de Amerikaanse justitie. ‘Dat hadden we van tevoren wel verwacht. Justitie trekt momenteel 8 miljoen dollar uit om onze analyse nogmaals te doen.’ Lafleur grinnikt. ‘Voor dat bedrag had ik het ook wel willen doen.’

Nerd box

De methodologie legt zij uit in een zogeheten ‘nerd box’. Wat is de foutmarge, hoe groot was het sample, is het reproduceerbaar, etc? ‘Voor eenvoudige acties in Excel, zoals optellen en vermenigvuldigen, hoef je zoiets niet te doen. Maar zodra je willekeurige samples doet of nominalen gebruikt, is dit noodzakelijk.’

Volgens Lafleur hoeven journalisten niet telkens het wiel opnieuw uit te vinden. ‘Sommige mensen besteden hun hele leven aan een bepaald onderwerp. Dan moet je niet proberen zelf een methodologie te bedenken.’ Veel contact met zulke experts voordat je aan een onderzoek begint, kan volgens de datajournalist veel tijd schelen.

Honderd busritten

Een ander voorbeeld is haar project over het gebrek aan informatie in de bus en de onbeschoftheid van chauffeurs bij eenvoudige reisvragen. Er was geen concrete informatie beschikbaar over hoe slecht de informatievoorziening in de bus was, dus heeft ze een database gemaakt van fysieke observaties.

‘Samen met een collega hebben we honderd willekeurig gekozen busritten gemaakt over de periode van een week.’ De resultaten sloegen ze op in een spreadsheet. Ook kregen ze de kans om enkele reizigers te spreken over de gebreken. Dat leverde een goede anekdote op over een buschaffeur die tegen een vrouw zei dat ze toch zelf kon zien welke bus dit was. ‘Nee, dat kan ik niet’, zei de vrouw. ‘Maar dat had u wellicht aan mijn blinegeleidenstok kunnen afleiden.’

Jerry Vermanen

Redacteur

Jerry Vermanen werkt als datajournalist bij KRONCRV.
Profiel-pagina
Nog geen reactie — begin de discussie!