Historici.nl





Gepubliceerd op 15-07-2021

Blog – Permanent perkament: hoe bewaar ik links naar digitale bronnen en hoe kan ik die het beste citeren?

Vorige week vroeg mediëvist Suzette van Haaren mij op Twitter hoe digitale bronnen op het web het beste duurzaam kunnen worden geciteerd. Dit is een probleem waar veel onderzoekers mee worstelen. Daarom leek het me een goed idee om een aantal tips en trucs te delen om verwijzingen te bewaren. 

Mediëvisten hadden het makkelijk, ooit. Hun soms duizend jaar oude primaire bronnen op perkament werden meestal veilig bewaard in de kluizen van bibliotheken of musea en in een enkel geval in de librije van een klooster of in de vitrine van de verzamelaar. Heftige natuurrampen, nare diefstallen, oorlog of ondoordachte decollectionering daargelaten, hoefden zij niet echt bang te zijn dat de geciteerde bron opeens verdween of dat de verwijzing niet meer klopte. Dit alles veranderde toen ‘middeleeuwse’ bronnen ook in afgeleide vorm op het web verschenen in de vorm van gedigitaliseerde manuscripten, beschrijvingen in blogposts of thematische websites met informatie over een handschrift. Net als al het andere op het web zijn dergelijke online bronnen ontvankelijk voor link rot (dode linkjes), omdat de gemiddelde webpagina maar negentig dagen online blijft en verwijzingen dus razendsnel kunnen doodlopen op een 404-pagina. De nood van de wetenschapper om een bron te kunnen citeren tot in de eeuwigheid legt het al heel snel af tegen de wil van de webmaster om de site actueel te houden, de juggernaut van de voortschrijdende techniek of de kosten van een website.

404-error message van het Catholic Diosese of Pittsburgh

Onderzoek op het web begint daarom met documentatie van elke link die wordt aangeklikt. Alleen het kopiëren van de URL volstaat niet, omdat de inhoud van een site snel verandert. Maak daarom regelmatig schermopnames. De meest eenvoudige manier om screenshots te maken: PrintScreen (prt sc)-toets of F10, of prt sc en Alt- of Windows-toets plus Shift plus S. In het eerste geval krijg je een afdruk van het hele scherm, in het tweede het actieve venster en in het derde een specifiek deel van het scherm. Met Ctrl-V kun je vervolgens de kopie plakken in Paint of een ander beeldbewerkingsprogramma. Zie ook de add-ons voor internetbrowsers zoals Fireshot, waarmee een pdf-bestand kan worden gemaakt van een webpagina. Vergeet niet het bestand op te slaan met een datum in de bestandsnaam, om het makkelijk terug te vinden (bijvoorbeeld: 2021.07.06_zelf_bewaren_bronnen.jpg). Voor meer mogelijkheden kun je het screenrecorderprogramma Snagit kopen via Surfspot: daarmee kun je bewegend beeld opnemen of een bepaald resultaat op een site vastleggen. Dat laatste is handig bij het raadplegen van een manuscript in IIIF (International Image Interoperability Framework) viewers, waarbij uit verschillende bronnen een manuscript wordt gereconstrueerd.

Ik heb nooit begrepen waarom websites worden geciteerd met ‘laatst geraadpleegd op’. De inhoud van de meeste websites is dynamisch en zelfs gepersonifieerd door de gebruikte browser, versie, instellingen, type beeldscherm, browserextenties (bijvoorbeeld adblockers), geografische locatie van de gebruiker, social media plugins of de manier van inloggen. ‘Laatst geraadpleegd’ heeft daarom evenveel wetenschappelijke waarde voor de reproduceerbaarheid van onderzoek als de referentie van Nicolaj Berdjajev: ‘This was once revealed to me in a dream’ in diens Divine and Human (1949).

De website Historici.nl als bekeken met browser Firefox 89.0.2 (boven) en dezelfde site met browser NCSA Mosai3 via Oldweb.today (onder).

De dynamische webpagina moet worden omgezet naar een statische bron met een permanente verwijzing in de vorm waarin de onderzoeker die heeft gezien. De eenvoudigste manier is gebruik te maken van de mogelijkheid ‘save page now’ van het Internet Archive of van Archive.is. Na inloggen zijn extra mogelijkheden beschikbaar: ‘Save outlinks’ (links buiten de pagina of site), ‘Save screen shot’ (schermopname op het moment van raadpleging) en ‘My web archive’. Dat laatste is handig als een site meerdere keren in de Wayback Machine is te vinden en je het precieze tijdstip van archivering niet meer kunt herinneren. 

‘Save page now’-optie op archive.org

Het Internet Archive heeft ook een add-on voor browsers waarmee webpagina’s rechtstreeks kunnen worden bewaard. Een andere optie is perma.cc (gratis is voor wetenschappelijke gebruikers via een instelling), dat ook permanente links genereert. 

Heb je inmiddels een dik proefschrift geschreven, maar moet je nog beginnen met het bewaren van de honderden bronnen? Geen paniek! Begin met het ‘oogsten’ (harvesten) van de links uit je document met de Harvester van Digital Methods Initiative. (Extra tip: is de pagina inmiddels offline, dan kun je via de Internet Archive Wayback Machine link ripper een gearchiveerde versie opzoeken die het dichtst bij de door jou gewenste versie is gearchiveerd.) Heb je een linklijst gemaakt met de Harvester? Stuur dan een mail naar savepagenow@archive.org met de URLs en na een paar minuten krijg je de links naar de gearchiveerde bronnen terug. 

Publiceer je iets in HTML? Probeer dan de site Robustify, die snapshots van webpagina’s maakt en HTML ‘snippets’ met permanente links genereert. Ook kun je gebruikmaken van de Zotero-extensie voor een browser die rechtstreeks in Zotero de verwijzingen permanent maakt.

Zijn de bronnen veilig, dan kun je beginnen met je eigen werk. Academia.edu of Researchgate zijn commerciële bedrijven die graag publicaties opnemen en veel functionaliteit bieden, maar geen garantie geven dat jouw werk nog over een generatie te vinden is. Bovendien verkopen ze je data. Daarom is het beter om je eigen werk (publicatie, dataset en nog veel meer) te bewaren in een repository van je universiteit of op Zenodo. Dat laatste is een online bewaarplaats voor wetenschappelijke publicaties en data, die wordt gesponsord door de Europese Commissie. Elk bestand krijgt z’n eigen ‘Digital Object Identifier’ (DOI) of permalink en is duurzaam opgeslagen en te citeren. Daarnaast kun je er ook voor kiezen om je blogs te screenshotten als pdf-bestand en te uploaden. 

Homepage van Zenodo.org

Tot slot: maak jezelf ook uniek en permanent. Als je een Open Researcher and Contributor ID (ORCID) account aanmaakt, dan kun je jouw unieke persoonlijke code aan je publicaties koppelen in Zenodo en andere repositories als NARCIS of Google Scholar. Wie schrijft, die blijft, maar wie webarchiveert, persisteert!

Avatar foto
Dr Kees Teszelszky (1972) studeerde politieke wetenschappen in Leiden en Oost-Europese studies in Amsterdam en is gepromoveerd op cultuurgeschiedenis aan de Rijksuniversiteit Groningen (2006). Hij deed een aantal jaar onderzoek naar het webarchief van de Koninklijke Bibliotheek. Sinds februari 2018 is hij conservator digitale collecties en houd zich bezig met de selectie, opslag en beschikbaarstelling van born digital bronnen, in het bijzonder websites, online nieuws en e-books. Daarnaast is hij een enthousiast webarcheoloog en doet projecten als het in kaart brengen van het Nederlandse Nationale webdomein, de Nederlandse blogosfeer en Nederlandse webincunabelen.
Alle artikelen van Kees Teszelszky
Historici.nl
Het KNHG is de grootste organisatie van professionele historici in Nederland. Het biedt een platform aan de ruim 1100 leden en aan de historische gemeenschap als geheel. Word lid van het KNHG.
Historici.nl
Het Huygens Instituut beoogt de Nederlandse geschiedenis en cultuur inclusiever maken. Het ontsluit historische bronnen en literaire teksten en ontwikkelt innovatieve methoden, tools en duurzame digitale infrastructuur.