Iedereen lijkt het dezer dagen over big data te hebben. Daarbij is niet altijd duidelijk hoe big big eigenlijk is. En ook niet of het daarbij over data of misschien ook wel over tekst gaat.
Dat 28 maart over dit thema een workshop wordt gegeven, is hier al eerder aan de orde geweest. Maar dat we er ook een lezing over hebben, bleef nog wat onderbelicht. Laura Hollink van het CWI houdt zich bezig met analyses van grote hoeveelheden tekst. Dat doet ze onder andere in samenwerking met de KB. In bovenstaande video komt dat onder meer aan de orde.
In haar lezing op 28 maart zal ze het vooral hebben over de analyse van verschuivingen in de betekenis en gevoelswaarde van woorden in de loop van de tijd. Hoe uit grote tekstcorpora dergelijke verschuivingen afgeleid kunnen worden. Inzicht daarin is van belang voor een betere werking van zoeksystemen die materiaal uit heel verschillende periodes doorzoeken en ook voor automatische documentclassificatie van dergelijk materiaal. Wie nu al iets over het werk van Laura bij het CWI wil horen (of 28 maart niet bij haar lezing kan zijn), kan nu al vast dit filmpje van eind november vorig jaar bekijken.
Op het plaatje hierboven zie je zes tripels. Maar slechts eentje daarvan komt op de VOGIN-IP-lezing aan de orde. Je mag zelf raden welke.
Op dit moment zitten er meer dan 50 miljoen items in en nog wel wat meer tripels waarmee eigenschappen aan die items gekoppeld worden (zoals dat Karmeliet een Tripel is). Niet alleen ten behoeve van Wikipedia-lemma’s, maar ook voor ieder ander systeem kan daar via internet kennis aan ontleend worden. Hopelijk zal Maarten ook nog op de SPARQL-queries ingaan, waarmee je gericht gegevens kunt opvragen uit open systemen, zoals Wikidata, die data als tripels beschikbaar stellen. [Zie ook dit nieuwe artikel hierover:
Een bericht van Arno Reuser:
Dit zijn de negen sprekers die 28 maart in acht lezingen aan het woord komen; met linksboven en rechtsonder onze keynote sprekers. In elk geval om te zien is het al een afwisselend gezelschap. Wie preciezer wil weten waar ze het over gaan hebben (en wie ze zijn), moet de teksten op
We zijn zeer verheugd een nieuwe keynote spreker te kunnen annonceren. Joseph Busch, afgelopen najaar nog keynote spreker bij het prestigieuse Taxonomy Bootcamp Congress in London, komt 28 maart naar Amsterdam.
Een klein tipje van de sluier rond de komende VOGIN-IP-lezing kunnen we al oplichten. We gaan het 28 maart niet hebben over bitcoins of andere cryptocurrency. Maar de achterliggende techniek van BlockChain is wel dermate interessant dat we willen kijken wat die kan betekenen voor toepassingen op ons gebied. We kunnen nu al verklappen dat er zowel een lezing als een workshop zal zijn die daar aandacht aan besteedt.







Voor wie het nog niet gezien (of bekeken) heeft: het merendeel van het materiaal – powerpoints e.d. – van de lezingen en workshops op 9 maart staat intussen op onze site.