Linkrot, linkroest en webarchieven

Unionhall Harbour (Co, Ireland)

9 maart klokslag half tien zal de VOGIN-IP-lezing zinderend van start gaan met de keynote van Herbert van de Sompel: “En toen was er niets meer”.
Herbert is een Gentenaar die nu al vele jaren in New Mexico werkt, bij het Los Alamos National Laboratory, een van de grootste onderzoekscentra in de VS. Hij heeft aan de wieg gestaan van een hele reeks van innovaties op ons terrein, zoals OpenURL link resolving (in SFX), de OAI-PMH en ORE-PMH protocollen, om metadata uit repositories te ‘harvesten’, en het Memento-protocol, om van intussen verdwenen of gewijzigde webpagina’s zo ongemerkt en automatisch mogelijk gearchiveerde oude versies te lokaliseren en op te vragen.
Dat laatste protocol poogt een probleem op te lossen dat Herbert de laatste jaren na aan het hart ligt: het feit dat zoveel links op internet, zelfs in en naar wetenschappelijke publicaties, vaak na korte tijd al niet meer correct werken. Óf de link werkt helemaal niet meer (link-rot), óf je komt op heel andere inhoud terecht, die intussen op dat oorspronkelijke webadres verschenen is (content-drift). Naar die twee vormen van reference-rot heeft hij, samen met collega’s, uitgebreid kwantitatief onderzoek gedaan. In [dit artikel] dat in december in PLOS|one is verschenen, rapporteren zij de uitkomsten van hun onderzoek. Hun conclusie is dat ruim 80% (!) van de 1.059.742 referenties die ze in hun onderzoek betrokken hadden, te lijden had van enige vorm van reference rot.
INTERVIEW MET HERBERT VAN DE SOMPELDe voorgestelde Memento-oplossing werkt helaas alleen als webpagina’s ergens gearchiveerd zijn – en ook afzonderlijk de achtereenvolgende versies daarvan, als het pagina’s zijn die aan verandering onderhevig zijn. Dat “archiveren” kwam dan ook met uitroeptekens terug in het interview dat IP-redacteur Frank Huysmans begin 2016 met Herbert van de Sompel had. Dat interview uit IP 2016|03 is hier [PDF] nog een keer na te lezen.

Meer informatie over Herbert’s keynote lezing is [HIER] te vinden.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s