Historici.nl

Gepubliceerd op 24-04-2019

De speld in de hooiberg en andere mogelijkheden van big data: Delpher als bron voor historisch onderzoek

De eerste dienstweigeraar

Johan van der Veer staat bekend als de eerste principiële militaire dienstweigeraar van Nederland. Van der Veer, een anarchistische agitator uit de kringen rond Ferdinand Domela Nieuwenhuis, weigerde in 1896 op te komen voor een herhalingsoefening en werd daarvoor veroordeeld tot enkele maanden gevangenisstraf. Een korte zoektocht op Delpher.nl, de website van de Koninklijke Bibliotheek (KB) waarop ruim honderd miljoen pagina’s uit Nederlandse kranten, boeken en tijdschriften digitaal doorzoekbaar zijn gemaakt, toont echter aan dat er ten minste één eerder geval van principiële dienstweigering was: Klaas Clay. Deze socialistische boekhandelaar uit Enkhuizen ontliep, tot grote frustratie van de autoriteiten, jarenlang zijn schuttersplicht door oproepen te negeren, en valse woonadressen op te geven. Meerdere malen veranderde hij van woonplaats als de grond hem te heet onder de voeten werd. Een kort artikel over zijn arrestatie en gevangenschap werd in 1894, twee jaar vóór Van der Veer dus, in diverse kranten gepubliceerd. Clay, en dus niet Van der Veer, was de eerste principiële dienstweigeraar van Nederland.

Dienstweigering Klaas Clay, Nieuwsblad van het Noorden 9 oktober 1894

De speld in de hooiberg

Hoe komt het dat meer dan 100 jaar lang is aangenomen dat Van der Veer Nederlands eerste dienstweigeraar was? Van der Veer was een bekendheid in de socialistische beweging. Hij sprak op openbare bijeenkomsten en schreef voor de socialistische krant Recht voor Allen. Zijn zaak werd door de Socialistenbond publicitair uitgebuit, en er werd door alle kranten verslag van gedaan. Clay daarentegen was een eenling die worstelde tegen het systeem. Van zijn zaak zijn alleen een paar kleine krantenartikeltjes, en een paar archiefstukken overgeleverd. Een speld in een hooiberg, als je niet weet waar je moet zoeken. En daarom is deze zaak in onderzoeken naar militaire dienstweigering nooit boven komen drijven. Natuurlijk, dit is een voetnoot in de Nederlandse geschiedenis, maar het laat zien wat de meerwaarde is van grote gedigitaliseerde bronnencollecties als Delpher: je kunt er de speld in de hooiberg mee vinden.

Delpher

Delpher is in 2013 ontstaan uit een samenvoeging van vier websites van de KB met gedigitaliseerde boeken, kranten en tijdschriften en wordt sinds die tijd steeds verder aangevuld, uitgebreid en verbeterd. Nu, in 2019, bevat Delpher ruim 100 miljoen pagina’s aan historische Nederlandse boeken, kranten en tijdschriften. De belangrijkste collecties zijn Nederlandse gedrukte boeken van de vijftiende tot en met de twintigste eeuw, Nederlandse kranten vanaf de allereerste uit 1618 tot en met 1995, en Nederlandse tijdschriften uit de negentiende en eerste helft van de twintigste eeuw. Al deze teksten zijn op woordniveau doorzoekbaar gemaakt. Delpher is voor iedereen gratis toegankelijk.

De oudst bewaarde Nederlandse krant Courante uyt Italien, Duytslandt, etc. 14 juni 1618

Nieuwe onderzoeksmethoden

In al deze gedigitaliseerde teksten kun je niet alleen de speld in de hooiberg vinden, je kunt ook geheel nieuwe vragen aan het materiaal stellen en nieuwe onderzoeksmethoden toepassen. Kwantitatieve informatie is nu bijvoorbeeld veel makkelijker te vinden: wanneer werd voor het eerst over een onderwerp geschreven? Hoe vaak werd over een onderwerp geschreven, in welke media, en in welke periode? Onderzoekers die zich bezighouden met Digital Humanities gaan nog veel verder. De KB levert onder voorwaarden datasets uit Delpher aan onderzoekers. Samen met computerprogrammeurs ontwerpen zij complexe zoekvragen en laten die los op miljoenen pagina’s historische tekst. Deze experimenten zijn veelbelovend en hebben al regelmatig geleid tot het bijstellen van bestaande opvattingen over geschiedenis. Één van de voorbeelden is het NWO Translantis project, waarin onderzoek gedaan wordt naar de invloed van Amerikaanse cultuur op de Nederlandse samenleving.

Werk  aan de winkel

Het bovenstaande is fantastisch en er is ook geen woord van gelogen. Toch zijn er nog een aantal verbeteringen mogelijk.  Ten eerste is Delpher nog lang niet compleet. Hoewel er maandelijks 850.000 gedigitaliseerde pagina’s aan de website worden toegevoegd, gaat het nog jaren duren voordat álle Nederlandse publicaties in Delpher te vinden zijn.

Een ander heikel punt in Delpher is de kwaliteit van de Optical Character Recognition (optische tekenherkenning). Dat is software die van een foto van een tekst een door de computer leesbare, en dus doorzoekbare tekst maakt. Elke fout die deze software maakt, zorgt er voor dat een woord niet vindbaar is omdat er minstens één letter niet klopt. Deze software maakt ook veel fouten omdat hij niet gemaakt is voor oude teksten in rare lettertypes die in vervaagde inkt zijn afgedrukt op vergeeld papier. Daarom kan de kwaliteit van de OCR op Delpher sterk variëren van heel goed (>99,95% van de tekens correct) tot heel slecht. Een derde belangrijke beperking wordt opgelegd door de auteurswet. Ook de Koninklijke Bibliotheek mag niet zomaar teksten op internet plaatsen als daar nog auteursrechten op rusten. Dat betekent dat voor vrijwel al het twintigste eeuwse materiaal eerst toestemming verkregen moet worden, en dat lukt niet altijd. Dat is een van de redenen dat er bijvoorbeeld nog geen publicaties van na 1995 op Delpher beschikbaar zijn en sommigen artikelen alleen in de leeszaal van de Koninklijke Bibliotheek kunnen worden gelezen.

Goudmijn

Dat neemt niet weg dat Delpher zich de afgelopen paar jaar heeft ontwikkeld tot één van de belangrijkste en meest gebruikte diensten van de Koninklijke Bibliotheek (ca. 250.000 bezoeken per maand). Delpher is een digitale goudmijn waar duizenden historici, genealogen, taalkundigen en andere onderzoekers niet meer zonder zouden willen.

Avatar photo
Huibert Crijns is collectiespecialist geschiedenis bij de Koninklijke Bibliotheek
Alle artikelen van Huibert Crijns
Historici.nl
Het KNHG is de grootste organisatie van professionele historici in Nederland. Het biedt een platform aan de ruim 1100 leden en aan de historische gemeenschap als geheel. Word lid van het KNHG.
Historici.nl
Het Huygens Instituut beoogt de Nederlandse geschiedenis en cultuur inclusiever maken. Het ontsluit historische bronnen en literaire teksten en ontwikkelt innovatieve methoden, tools en duurzame digitale infrastructuur.