leidenislamblog

Oproep aan universiteiten: Investeer in duurzaam digitaliseren

Oproep aan universiteiten: Investeer in duurzaam digitaliseren

Hoe moeten bibliotheken zich in een digitaliserende wereld staande houden? Birte Kristiansen, die onlangs na 10 jaar stopte als vakreferent Midden-Oosten bij Universiteit Leiden, vindt dat er duurzamer geïnvesteerd moet worden in digitale collectievorming.

Als historici over tweehonderd jaar terugkijken op onze tijd, is de kans groot dat zij die zullen bestempelen als de periode van de informatierevolutie. Door de enorme hoeveelheid beschikbare informatie, zowel in print als digitaal, wordt het steeds lastiger om een goede bibliotheekcollectie aan te leggen en te onderhouden.

De wereldberoemde Leidse Midden-Oosterse bijzondere collecties zijn nog altijd belangrijk, maar hoe houden we de Midden-Oosten collecties ook in de toekomst relevant? Steeds meer output binnen het vakgebied wordt in digitale vorm gepresenteerd, bijvoorbeeld op websites, in databases, filmpjes en blogs. Dat werkt uitstekend zolang het project in volle gang is, maar een langetermijnplan ontbreekt vaak.

Informatie bewaren

Welke informatie uit het enorme aanbod moet bewaard worden? Deze vraag is relevant voor zowel wetenschappelijke als voor niet-wetenschappelijke output die als bron kan dienen. Zo zijn de meeste onderzoekers het erover eens dat sociale media een cruciale rol speelden bij het ontstaan en het verloop van de Arabische Lente, maar hoe bepalen we wat bewaard moet worden en wie ziet daarop toe?

Het aantal dode links op Arab Spring: A Research & Study Guide van Cornell University illustreert dit probleem goed. Niet alleen Facebookberichten zijn vluchtig, ook internationale onderzoeksrapporten veranderen van internetadres of lijken binnen enkele jaren helemaal van het internet te verdwijnen. E-mailcorrespondentie tussen wetenschappers wordt evenmin duurzaam bewaard. Op die manier dreigt juist in dit informatietijdperk een schat aan informatie voor toekomstig onderzoek verloren te gaan.

De oplossing? Universiteiten moeten veel meer investeren in de opslag van wetenschappelijke output en data in veilige repositoria met vaste webadressen (persistent identifiers). Daarnaast moeten wetenschappers alert zijn en tijdig zelf hun digitale output en de digitale bronnen die zij gebruiken veiligstellen. Universiteiten moeten daar dan wel een infrastructuur voor aanbieden en die is momenteel vaak nog heel beperkt.

Informatie duurzaam opslaan en toegankelijk houden

Bij het toegankelijk houden van digitaal materiaal komt veel kijken: hardware, software, providers, webadressen, beveiliging, versie-updates etcetera. Voor veel digitale output van onderzoeksprojecten, zoals online databases, blijkt geen langetermijnplan te zijn. Het heeft geen zin om digitale informatie op te slaan zonder context, zonder metadata en zonder de benodigde software om de data te kunnen lezen. Databases die aan het einde van een project weer roemloos verdwijnen zijn een groot gemis voor de voortgang van de wetenschap.

De oplossing is niet altijd duidelijk. Het advies is echter wel: denk na over langetermijnopslag zodra je begint met een digitaal wetenschappelijk product. Zo kun je er bijvoorbeeld voor kiezen om van een mooi interactief blog ook een ‘platte tekst’ in pdf-formaat te archiveren, die weinig onderhoud nodig heeft.

Informatie terugvinden

Zelfs als informatie goed opgeslagen wordt, bereikt die potentiële gebruikers niet altijd. Terugkerend naar de Arabische Lente: The Internet Archive heeft een archief aangelegd met daarin allerlei internetbronnen over de Arabische Lente. Ook op allerlei andere plekken probeert men overzichten bij te houden met verwijzingen naar interessante websites:

Via Google komt deze informatie echter niet zo makkelijk bovendrijven; gericht zoeken in dit soort overzichten levert vaak meer op. Het bijhouden van zulke lijstjes kost echter veel tijd en ze verouderen snel. Een structurele oplossing voor dit probleem ontbreekt dus.

De kwaliteit van geboden informatie

Zelfs als bepaald materiaal wel duurzaam gearchiveerd wordt als primair bronmateriaal voor toekomstig wetenschappelijk onderzoek, moeten we echter alert blijven bij het gebruik ervan in onderzoek.

Juist omdat er maar heel selectief materiaal opgeslagen wordt, is er namelijk een grote kans op vertekening. Wanneer bijvoorbeeld onevenredig veel bronnen over fundamentalistische uitwassen binnen de islam bewaard worden, en het bewaarbeleid geen ruimte biedt voor andere stemmen en stromingen, dan ontstaan er archieven en collecties die geen recht doen aan de werkelijkheid.

Het probleem van ongebalanceerde collecties is niet nieuw en ook niet uniek voor digitaal materiaal, maar de schaal van het probleem is wel nieuw.

Omgaan met informatie in de toekomst

Omdat duurzaamheid en betrouwbaarheid van informatie momenteel op de proef worden gesteld, zijn bibliotheken belangrijker dan ooit. Toegegeven, op de korte termijn zijn bibliotheken met hun logge systemen vaak geen partij voor Google en dat verklaart ook waarom niet iedereen ‘de bibliotheek’ even hoog op de prioriteitenlijst heeft staan.

Op de lange termijn vormen bibliotheken echter een belangrijk tegenwicht tegen het ontstaan van informatiemonopolies. Een bedrijf als Google kan door kleine aanpassingen in de zoekalgoritmes grote invloed uitoefenen op de resultaten die gevonden worden. In dat licht moet het belang van een wereldwijd netwerk van onafhankelijke bibliotheken niet onderschat worden en is het belangrijk dat universiteiten en overheid hierin blijven investeren.

Voor de Midden-Oosterse collecties in Leiden geldt dat de ‘ouderwetse’ taken van collectievorming zoveel tijd in beslag nemen, dat er maar zeer beperkt ruimte is om te experimenteren met nieuwe manieren van digitale collectievorming. Er worden voorzichtige pilots gedraaid met het archiveren van e-mailcorrespondentie van hoogleraren. Er zijn wat kleinschalige initiatieven, bijvoorbeeld om Leidse niet-duurzame output duurzaam te archiveren in het Leids Repositorium.

Als Leiden met zijn digitale collecties echter dezelfde faam wil verwerven als met de ‘klassieke’ collecties, is een enorme schaalvergroting nodig en die capaciteit is er niet. Dat is jammer want ‘digitaal’ is niet meer weg te denken uit de wetenschap en duurzaam digitaal beheer hoort daarom bovenaan elke wetenschapsagenda. Het gaat dan niet alleen om het digitaliseren van de erfgoedcollecties, maar juist ook om het zorgvuldig bewaren en toegankelijk houden van nieuwe digital-born collecties.

1 Comment

Tjalling Halbertsma

Het gaat over de kans dat dingen niet meer makkelijk terug gevonden worden. Ik schreef vorig jaar de universiteit aan een werkgroep "bijwerkingen" op te zetten. Samengevat: We kunnen straks zoveel (op digitaal gebied,) maar kunnen wij het nog wel aan ? Wat doen we als de hoeveelheid werk per jaar in het qwardraat vermeerderd ?
Er bestond geen interesse voor mijn voorstel en het werd ook niet begrepen. P.S. Ik ben van 1925