Nieuwe journalistieke software schrijft met gemak een artikel per minuut. Een logische stap in mediainnovatie of de doodsteek voor de worstelende nieuwsindustrie? Feit is:  “soms schrijven ze het betere verhaal.”

Half april kopte de ene na de andere Amerikaanse website: “Robot schrijft beter sportverslag dan journalist.” Onderzoekers van het bureau Narrative Science uit Evanston, in de buurt van Chicago, hadden een softwareprogramma een sportverslag laten opstellen dat als beter werd beoordeeld dan een artikel geschreven door een levend persoon.

De aanleiding voor het wedstrijdje was een artikel op de sportwebsite van de George Washington University, GWSports.com. Daarin was verslag gedaan van een honkbalwedstrijd waarin pas in de een na laatste alinea was vermeld dat de pitcher van de University of Virginia, Will Roberts, een foutloze wedstrijd had gespeeld. Dat is een feit dat normaal gesproken zonder twijfel bovenin het artikel zou moeten staan.

Journalisten van de sportwebsite Deadspin wisten het zeker, dit verhaal moet wel door een robot geschreven zijn. Ze schreven hun verontwaardiging op en lieten duidelijk merken dat het op deze manier nooit wat zou worden met de geautomatiseerde verslaglegging. Narrative Science nam die uitdaging aan en liet hun programma met dezelfde feiten ook een artikel schrijven. De eerste zin van de robot: “Dinsdag was een geweldige dag voor W. Roberts. De junior pitcher gooide een foutloze wedstrijd en bracht Virginia een 2-0 overwinning op George Washington.”

Emma Carmichael van Deadspin kon niet anders dan toegeven: “Wat ik nu zie van de robot overtuigt me zeker wel,” aldus de sportverslaggeefster op National Public Radio. “Soms schrijven ze het betere verhaal.” Later is duidelijk geworden dat het artikel op GWSports.com was geschreven door een medewerker van de universiteit, en niet door een sportjournalist. Maar het voorbeeld maakt duidelijk dat het programmeerbare nieuws grote vorderingen maakt.

Houterige machinetaal
Vooral sportwedstrijden lenen zich voor computerreportages omdat ze vaak voorspelbare informatie bevatten. Er is altijd een winnaar of gelijk spel. Er zijn altijd uitblinkers en tegenvallers; mooie scores en gelukkies. Je verandert de namen en klaar is kees. Dat het zo eenvoudig niet ligt, weten de oprichters van Narrative Science, Kris Hammond en Larry Birnbaum. Hoewel al jaren wordt geprobeerd met een computer uit namen en statistieken een artikel te maken, is het hun pas recentelijk gelukt af te komen van de houterige machinetaal die dat vaak opleverde.

Hammond en Birnbaum werkten eerst jaren bij de Intelligent Information Laboratory van de Northwestern Universiteit, voordat ze met steun van de universiteit en andere investeerders het commerciele Narrative Science startten. Volgens Oren Etzioni, een taal- en computerwetenschapper van de Universiteit van Washington, is het bedrijf er als eerste in geslaagd een computer taal te laten begrijpen, om er daarna taal mee te kunnen genereren.

In the New York Times legde Hammond onlangs uit hoe zijn programma te werk gaat. De basis van de software is een dataset met typische zinsneden uit eerdere verslagen van sportwedstrijden. Het gaat hierbij onder meer om observaties van spelsituaties, feitjes en emoties. Het intelligente deel van het programma kiest vervolgens een invalshoek voor een verhaal en bepaalt de volgorde van de gebeurtenissen die het in het verslag wil opnemen. Ook daarbij leunt het op voorbeelden van eerdere artikelen.

Typische termen die in de Amerikaanse sportverslaggeving worden gebruikt zijn bijvoorbeeld ‘individuele actie’, ‘spelopbouw’, ‘van achter de man komen’, en ‘heen en terug’. Cruciaal in het verhaal is welke kwalificatie het programma geeft aan de wedstrijd. Was het een makkelijke overwinning of spannend tot de laatste minuut. “Compositie is het sleutelconcept,” aldus Hammond. “Het gaat hier niet om simpelweg tekst maken uit data.” Over hoe zijn programma precies een wedstrijd interpreteert, welke informatie het daarvoor ingevoerd krijgt en in welke mate een mensenhand nog bijdraagt aan de keuzes die vervolgens in de compositie worden gemaakt, wil Hammond niets prijsgeven.

De robots komen?
De vraag is of programma’s als die van Narrative Science in de toekomst het werk van de sportverslaggever helemaal overbodig kunnen maken. Hammond en zijn collega’s benadrukken dat de artikelen die zij produceren vooral geschikt zijn om diepgravender berichtgeving te ondersteunen, of om lowbudget websites te voorzien van eenvoudige content. Het bedrijf, dat nu een jaar bestaat, heeft twintig klanten. Narrative Science wil niet zeggen om wie het gaat. Maar er zitten kranten tussen die meer lokale sportwedstrijden willen verslaan. Maar ook financiele berichtgeving en artikelen over de huizenmarkt worden door verschillende websites al door de computer gemaakt.

Overigens zijn tekstrobots niet de enige innovatie die aan de poten van het journalistieke handwerk zagen. In Japan wordt gewerkt aan een androïde, fysieke robot die zelfstandig foto’s kan maken in situaties waar verslaggevers hun leven niet zeker zijn.  In rampen- of oorlogsgebieden, bijvoorbeeld. De robot maakt daarin zelfstandige journalistieke afwegingen. En wat te denken van het Leidse onderzoek dat probeert met software foto’s te interpreteren en te indexeren.  Hoe klein is dan de stap naar software die geautomatiseerd onderschriften maakt?

Al 8 reacties — discussieer mee!