Mediacloud: wordt nieuws van blogs echt vanzelf opgepikt?

cloudTegenwicht bieden aan de anekdotische basis waarop veel internetonderzoek is gebaseerd. Dat is het doel van Mediacloud www.mediacloud.org, een nieuwe tool voor media-onderzoekers die onlangs werd gelanceerd door het Berkman Center for Internet & Society. Initiatiefnemer Ethan Zuckerman geeft een toelichting bij de eerste versie van de software.

“Hier op het Berkman center hebben we onderling regelmatig discussies over de impact van nieuwe media op de samenleving. Yochai Benkler bijvoorbeeld stelt dat bloggers die niet tot de gevestigde orde horen een belangrijke rol kunnen spelen in het publieke debat. Hij heeft daar een aantal mooie voorbeelden van. De meeste mensen kennen ze inmiddels wel. Denk aan zaken als ‘Rathergate‘, waarin bloggers met succes de echtheid betwistten van de documenten die volgens het programma 60 Minutes zouden bewijzen dat George W. Bush onder deelname aan de Vietnam-oorlog probeerde uit te komen.

De hamvraag is nu: zijn dergelijke zaken de regel? Of eerder een uitzondering? Ik ben zelf iets minder optimistisch dan Benkler. In discussies bieden we nu steeds met anekdotes tegen elkaar op. Maar zou het niet mooi zijn als we wat meer vaste grond onder onze voeten hadden in deze discussie? Als we kwantitatief vast zouden kunnen stellen waar in het medialandschap bepaalde zaken aan de orde worden gesteld, en hoe ze vervolgens van het ene naar het andere medium springen? Worden zaken die op blogs aan de orde worden gesteld, echt vanzelf opgepikt? Of is het in de regel eerder andersom, en zijn het nog altijd de traditionele media die leidend zijn in het bepalen van het publieke debat?

Om dat te achterhalen ontwerpen we een computerprogramma dat automatisch de berichten van duizenden politieke blogs en traditionele media kan analyseren. Daarvoor maken we gebruik van semantische analysemogelijkheden van Calais, een programma dat teksten analyseert en grofweg aangeeft waar ze over gaan.

De eerste versie van Mediacloud is nog niet zo geavanceerd. We kunnen nu eenvoudige berekeningen maken, bijvoorbeeld: hoeveel artikelen in de Boston Globe besteedden aandacht aan Obama? Of aan Nederland? En hoe verhoudt dat zich met de aandacht die andere kranten aan deze onderwerpen besteedden? We kunnen zo voor allerlei media een label maken met de verhoudingen van hun ingrediënten: deze krant besteedt zoveel procent van haar artikelen aan sport, zoveel aan buitenlands nieuws, waarvan weer zoveel procent aan het Midden-Oosten en weer een ander percentage aan Afrika. Dat lijkt vrij simpel, maar het is technisch al vrij gecompliceerd.

Het idee is dat Mediacloud een platform wordt dat mediaonderzoekers als basis kunnen gebruiken voor hun eigen onderzoek. Overigens is het natuurlijk niet zo dat kwantitatief onderzoek zaligmakend is. Als je wilt onderzoeken of een bepaald medium al dan niet een politieke kleur heeft, is het natuurlijk niet genoeg om alleen maar te tellen hoeveel linkse en rechtse politici er aan het woord komen. Maar zo’n statistisch overzicht – dat mediacloud zou kunnen genereren – kan wel heel goed als basis voor verder onderzoek dienen: je kunt dan vervolgens de betreffende artikelen opvragen en verder analytisch onderzoek doen.

Interessanter vind ik het om vergelijkend onderzoek te doen. We hebben nu een tool ontwikkeld waarmee je kunt onderzoeken welke woorden met bepaalde onderwerpen worden geassocieerd. Als je bijvoorbeeld op Zimbabwe zoekt, zie je dat op de BBC-website in artikelen waarin Zimbabwe wordt genoemd, regelmatig de namen van andere Zimbabwaanse politici opduiken. Bij CNN komen we vooral termen tegen die verwijzen naar de regering van president Obama. Hieruit kun je afleiden dat CNN vooral over Zimbabwe schrijft vanuit het perspectief van het Amerikaanse Buitenlandse Zaken-beleid, terwijl de BBC vaker rapporteert over de politieke situatie in Zimbabwe zelf.

Ik wil Mediacloud ook gaan gebruiken om een soort ‘voedingslabels’ voor media te maken. Ik wil graag een overzicht presenteren van de precieze samenstelling van het nieuws in verschillende media. Welke onderwerpen komen wel en niet aan bod? Welke landen vallen buiten de boot in de berichtgeving? Ik heb het idee dat traditionele media over een veel diverser aantal onderwerpen berichten dan weblogs doen, die naar mijn idee veel meer op een kluitje opereren. Dat is belangrijk om te weten, in een tijd waarin traditionele journalistiek wordt bedreigd. We moeten weten wat we missen, mochten kranten inderdaad verdwijnen.

Het internet is wat dat betreft ergens een gevaarlijk medium: het is zo groot, dat iedereen er vanuit gaat dat alle onderwerpen wel ergens in een hoekje van het internet worden gecovered. En vervolgens laten we onze aandacht verslappen: als het belangrijk is komt het vanzelf wel boven drijven is de gedachte. Maar is dat ook echt zo? Ik betwijfel het. En als er inderdaad een enkele blogger is die aandacht heeft voor laten we zeggen de politieke situatie in Madagascar, wordt zijn berichtgeving dan ook inderdaad opgepikt, zoals bijvoorbeeld laatst toen er een coup plaats vond? Het is de taak van de journalistiek om ons van dit soort gebeurtenissen op de hoogte te houden. Maar gebeurt dat nog? Met Mediacloud hopen we dat soort vragen te kunnen beantwoorden.”


4 reacties:

Steeph
7 mei, 2009

Maar richt dit tool zich niet alleen op de engelstalige media? Of gaat het Nederlands er automatisch in mee?

Ben ook wel nieuwsgierig naar je bevindingen.

Martijn de Waal
7 mei, 2009

Hallo Steeph, Ik heb het nog even gecheckt bij Ethan, en dit is wat hij terugschrijft.

You can use media cloud in other languaues but Calais is English only at this point. Means you need to develop your own keywords list in Dutch.

Je kunt dus de mediacloud software gebruiken om Nederlandstalige bronnen te volgen, maar de semantsiche analyse vereist extra werk.

Steeph
7 mei, 2009

Mmmm, moeten dus iemand zo gek vinden om die keywordlist op te stellen. Best een stevige klus.

Komt dat mediacloud ook in het publieke domein? Of is het alleen voor onderzoekers beschikbaar?

Robert Buzink
19 mei, 2009

@Steeph Mediacloud is Open Source software.

Iemand al bezig met de Nederlandse lijst voor Calais? Misschien kunnen we samenwerken. Stuur een mailtje.


Laat een reactie achter »