A LOD of triples


Hopelijk heb je al eerder van LOD gehoord en van de Linked Open Data cloud. Zo niet, dan zie je hierboven hoe die wolk eruit ziet. Althans hoe hij er in maart 2019 uitzag, want die wolk groeit nog steeds. Niet dat er in dit formaat al veel aan die wolk te zien valt, want 1239 datasets met daartussen 16147 links, zijn niet zo makkelijk inzichtelijk in een enkel blogpost-plaatje te verwerken. En zelfs als je een klein stukje uit het centrum van die wolk uitvergroot, zie je daar nog altijd niet heel veel aan en is het nog altijd moeilijk leesbaar. Als je goed kijkt, kun je wat rechtsboven het centrum – waar de meeste links heen gaan – wel de DBpedia onderscheiden, de gestructureerde feitenverzameling die uit de Wikipedia is afgeleid. En wat meer naar linksonder Wikidata, een runner-up die als databron snel in belang toeneemt.


En de rest zijn datasets van allerlei verschillende organisaties die hun gegevens op gestandaardiseerde wijze vrij via internet beschikbaar stellen. Die 1239 in de wolk afgebeelde datasets zijn dan nog alleen diegenen waar tenminste 1000 tripels – losse feiten – inzitten. In die hele cloud zitten naar schatting nu al meer dan 150 miljard tripels. Uit de animatie hieronder kun je een aardige indruk krijgen hoe die cloud gegroeid is, van de eerste 12 datasets in 2007 tot de 300 die er in in 2011 waren. Toen zijn ze maar opgehouden dit soort bewegende plaatjes te maken. Intussen zijn het er nog weer ruim 4x zoveel.

Misschien goed in dit verband nog even te memoreren dat het idee van Linked Open Data ook uit de koker van Tim Berners Lee is gekomen. Hoewel het al een paar jaar broedde, kwam hij er in een TED-lezing in 2009 echt mee naar buiten en maakte hij duidelijk dat hij meer data beschikbaar wilde hebben door een hele zaal in Long Beach (Californië) uit volle borst te laten scanderen
“RAW DATA NOW! RAW DATA NOW! …”
Intussen is wel duidelijk dat die ruwe data er inderdaad in overvloed gekomen zijn.

Weet je nog niet echt wat tripels zijn en wat linked data is? En heb je eerdere workshops gemist waarin dat aan de orde kwam? Dan zul je je nu zeker moeten aanmelden voor de workshop van Hugo Benne. Want daar worden die begrippen uitgelegd en kom je te weten hoe dat allemaal werkt. En vooral ook wat je er aan kunt hebben, hoe je er gebruik van kunt maken en hoe je als organisatie eigen data kunt bijdragen (en dus nog steeds gehoor kunt geven aan die oproep van Tim Berners Lee van elf jaar geleden).

rawdatanow