Het is doodzonde dat talloze journalistieke producties zo maar van het internet verdwijnen

Journalistieke producties en websites zijn soms zomaar opeens verdwenen van het internet. Of ze staan half verminkt op een website. Wat kan daar aan gedaan worden?

Journalistieke verhalen die verdwijnen; het is geen marginaal probleem. In oktober begon J-lab van de Hogeschool Utrecht verdwenen journalistieke verhalen en website te verzamelen. In Meldpunt Prullenbak verschenen voorbeelden van diverse nieuwsmedia: kleine lokale spelers, maar ook NOS, VPRO en de Volkskrant kampen met dit probleem. Gebrek aan kennis over het behoud van online archieven speelt zeker een rol, maar zoals ik oktober voor J-lab schreef, is de technologie ook nog niet toereikend om alle vormen van online journalistieke verhalen te archiveren.

Op 15 februari hopen wij het kennishiaat gedeeltelijk te verhelpen. Tijdens de expertisemiddag webarchivering bij Beeld & Geluid, brengen we het probleem in kaart en ontdekken we welke oplossingen hiervoor zijn. We nemen een kijkje in de keuken van professionals die het wel is gelukt, en laten zien hoe we hun oplossingen kunnen toepassen in de journalistiek. Schrijf je hier in voor de Expertisedag. Entree is gratis.

Wil je vermiste content melden? Dat kan hier.

Wat onderzoeken we?

Uiteraard draait het allemaal om verdwenen journalistieke verhalen en websites. Specifieker richt het onderzoek zich op digitale content die is verdwenen: content die digitaal geboren is. De pdf-krant of uitzendingen die later online verschijnen, laten wij buiten beschouwing. Ook verhalen die bewust offline worden gehaald omdat er een ethische kwestie speelt, nemen wij niet mee in dit onderzoek.

Wat blijft er dan over? Nog heel veel! Verdwenen nieuwswebsites, niet-werkende interactieve verhalen, sub-merken die ophouden te bestaan, journalistieke start-ups die het niet redden. Naast de meldingen in Meldpunt Prullenbak, hebben we zelf de data aangevuld op basis van eigen onderzoek. Tot nu toe hebben we 54 cases verzameld. Om grip te krijgen op het probleem, hebben de data ingedeeld in vier categorieën.

1. Verdwenen

Dit is content waarvan wij niet hebben kunnen achterhalen of het nog bestaat. Hiervan is Planet.nl het meest opzienbarende voorbeeld. Als je de link volgt, kom je uit op de algemene website van KPN, maar de eerste internetkrant van Nederland is nergens meer te vinden. In The Way Back Machine vind je enkele snapshots van de site, dus we weten nog wel hoe het eruit heeft gezien in de begin jaren:

planet_nl_verdwenen_content_jlab_webarchivering copy

Planet.nl werd tot 31 december 2007 door een redactie voorzien van nieuws en andere journalistieke verhalen, maar het meeste hiervan is niet meer te vinden. Een mooie uitzondering is SHIFT van Erwin van der Zande <http://www.vanderzande.com/shift/>. Volgens Wikipedia werd het nieuwsgedeelte overgenomen door DAG.nl (gestopt in 2009), maar ook hiervan zijn slechts enkele snapshots bewaard gebleven. Zoals je op de onderstaande screen capture kan zien, is ook The Way Back Machine beperkt. Applicaties gemaakt in Flash worden hier zijn niet zichtbaar:

dag_nl_verdwenen_content_jlab_webarchivering copy

2. Offline bewaard

Dit is content die online niet meer te vinden is, maar waarvan we weten dat het offline of in een niet-publieke database is opgeslagen. Uiteraard is het lastig na te gaan of alle verloren content nog ergens op een harde schijf staat. Op basis van een Facebook-conversatie, weten we vrij zeker dat de meeste content van het in 2012 verdwenen Wetenschap24 nog op iemands harde schijf staat:

wetenschap24_verdwenen_content_jlab_webarchivering copy

Ook Dichtbij.nl is een goed voorbeeld. De website is in zijn geheel offline gehaald en intern opgeslagen. TMG werkt aan een oplossing:

Dichtbij_nl_verdwenen_content_jlab_webarchivering copy

3. Kapotte links

Content waarvan de link ‘kapot’ is vormt een categorie op zich, en wordt vaak per toeval ontdekt omdat bezoekers op een 404-pagina terecht komen. Het fenomeen wordt ook wel link rot genoemd. Deze verhalen staan nog online, maar oude links werken niet meer. Het probleem ontstaat meestal bij de migratie van een website naar een ander domein. Recent ging het mis bij De Telegraaf. Na een migratie van de website, bleken links niet meer te werken. TMG heeft het probleem inmiddels verholpen.

4. Misvormde verhalen

In dit geval staat het verhaal nog online, maar niet meer in de vorm waarin het origineel is gepubliceerd. Denk aan ontbrekend beeldmateriaal, of niet werkende interactieve elementen. De Eritrea-route. Een digitale routekaart waarop te zien is welke weg Eritrese vluchtelingen afleggen naar Ter Apel van One World is een mooi voorbeeld. De redactie maakte een interactieve kaart op StoryMapsJS, maar die kaart is verdwenen terwijl het aankeilende artikel nog online staat:

Eritea_route_one_world_jlab_webarchivering_verdwenen_content copy

Ook zien we soms verhalen voorbijkomen waar verdwenen foto’s een gat achterlaten, zoals bij Why you so fat? van NRC:

Why_you_so_fat_nrc_verdwenen_content_jlab_webarchivering copy

Hoe nu verder?

Een structurele oplossing is er nog niet. Voorlopig kan ik jullie slechts een algemene conclusie bieden. Het probleem is wijdverbreid, en neemt verschillende vormen aan. Helaas bestaat er geen magische tool waarmee je makkelijk een hele website voor eeuwig en in elke vorm kan opslaan. Gelukkig zijn er wel tools beschikbaar waarmee je zelf (en met veel handwerk) online content kunt archiveren. Hiervoor raad ik Webrecoder aan.

Ook is het belangrijk dat nieuwsmedia zelf een archief opbouwen dat niet alleen via een browser toegankelijk is, zoals nu vaak het geval is. Wat als op een dag onze browsers niet meer werken?

Wil je op 15 februari aanwezig zijn op de expertisemiddag webarchivering bij Beeld & Geluid? Meld jedan  hier aan. 

Renée van der Nat –

Renée van der Nat werkt als onderzoeker voor het lectoraat Crossmediale Kwaliteitsjournalistiek aan de Hogeschool Utrecht.

Alle artikelen van Renée van der Nat op De Nieuwe Reporter.