Tip 1: Vraag – als je een verzoek indient bij een woordvoerder – nooit om ‘(onderliggende) data’

Het woord ‘data’ klinkt eng, Cambridge-Analytica-esque en riekt naar privacyschending. Is natuurlijk helemaal niet zo, maar dat weten zij niet. Vraag om een tabel, spreadsheet, overzicht, lijst, of cijferreeks.

Tip 2: Bekijk altijd eerst de kolomtitels in je dataset: wat is wat?

Doe dit voordat je gaat numbers crunchen. Op basis van de kolomtitels kun je namelijk zien wat er in je dataset zit en ontdek je meteen welke vragen je ‘aan’ de dataset kunt stellen. Het maakt niet uit of je nou vijf of vijftigduizend rijen in je dataset hebt, de vragen blijven hetzelfde.

Tip 3: Probeer altijd drie ‘soorten cijfers’ te verzamelen/te berekenen

Komen ze:

  1. absolute aantallen
  2. relatieve cijfers, bijvoorbeeld het aantal per duizend inwoners
  3. de procentuele ontwikkeling (nieuw-oud/oud*100. Haal je havo 4-economieskills weer even naar boven)

Deze drie variabelen bieden je alle handvatten voor een compleet bericht.

Tip 4: Staat je tabel in een pdf-bestand? Huilon. But there’s an app for that!

Tik geen cijfers handmatig over, maar gebruik een tool als Tabula om supereenvoudig tabellen uit pdf’s te ‘scrapen’ en om te zetten in een csv-bestand (dat je vervolgens kunt openen in Excel)

Tip 5: Ben je op zoek naar data, maar is er geen tabel voorhanden? Check of er iets gemeld wordt

Als iets ergens wordt gemeld, wordt deze info mogelijk ook ergens opgeslagen. Denk aan verkeersinformatiemeldingen of inspectierapporten.

Tip 6: Wil de bronhouder geen cijfers leveren? Kijk dan of die organisatie moet rapporteren

Veel organisaties moeten rapporteren aan een hoger orgaan, bijvoorbeeld een ministerie. Daar kun je de cijfers opvragen: gewoon met een mailtje of belletje, of via de wob (wet openbaar bestuur).

Tip 7: Cijfers zijn relatief makkelijk te wobben. Probeer het eens!

Okay, het gaat lang niet altijd goed en sommige processen duren vreselijk lang. Maar de zwartste scenario’s – volledig zwartgelakte documenten – hebben we met LocalFocus nauwelijks meegemaakt. We gebruiken met LocalFocus tegenwoordig een ‘standaardwob’ die we qua opzet hergebruiken en qua inhoud aanpassen. Best wel effectief!

Tip 8: Dubbelcheck uitschieters

Is iets ‘too good to be true’? Die extreme stijging, of die heftige outlier, bijvoorbeeld? Check altijd eerst of er niet een suffe statistische oorzaak is zoals een methode- of definitiewijziging. Bel dit desnoods even na. Je wilt immers niet dat je knaller van een nieuwskop onderuit gehaald wordt door een methodologische misvatting.

Tip 9: Ga tussentijds visualiseren!

Zet je cijfers ook voordat je gaat publiceren om in staafjes, bollen, lijnen, kleuren en vlakken. Dit helpt je om snel antwoorden te vinden op de vragen die je ‘aan’ je dataset hebt gesteld. Gebruik visualisaties dus als analysetool.

Tip 10: sharing = caring

Je hoeft niet alle facetten van datajournalistiek even goed te beheersen (ik kan bijvoorbeeld voor geen meter programmeren). Als je maar wél weet wat de mogelijkheden zijn: there’s always a nerd nearby!

Heb jij zelf nog handige datadingentips? Stuur dan een mailtje naar yordi@localfocus.nl.

Deze blog verscheen eerder op de website van Local Focus.

Yordi Dam

Yordi Dam is mede-oprichter en datajournalist van LocalFocus.
Profiel-pagina
Nog geen reactie — begin de discussie!