Big data en data-mining

Iedereen lijkt het dezer dagen over big data te hebben. Daarbij is niet altijd duidelijk hoe big big eigenlijk is. En ook niet of het daarbij over data of misschien ook wel over tekst gaat.

Dat 28 maart over dit thema een workshop wordt gegeven, is hier al eerder aan de orde geweest. Maar dat we er ook een lezing over hebben, bleef nog wat onderbelicht. Laura Hollink van het CWI houdt zich bezig met analyses van grote hoeveelheden tekst. Dat doet ze onder andere in samenwerking met de KB. In bovenstaande video komt dat onder meer aan de orde.
In haar lezing op 28 maart zal ze het vooral hebben over de analyse van verschuivingen in de betekenis en gevoelswaarde van woorden in de loop van de tijd. Hoe uit grote tekstcorpora dergelijke verschuivingen afgeleid kunnen worden. Inzicht daarin is van belang voor een betere werking van zoeksystemen die materiaal uit heel verschillende periodes doorzoeken en ook voor automatische documentclassificatie van dergelijk materiaal. Wie nu al iets over het werk van Laura bij het CWI wil horen (of 28 maart niet bij haar lezing kan zijn), kan nu al vast dit filmpje van eind november vorig jaar bekijken.

Data expert in twee uur?

Dit artikel uit NRC-Handelsblad van 25 november leidde op Twitter tot nogal wat boze reacties. Belachelijk om te suggereren dat je in één dag tot zoiets specialistisch als een data-expert opgeleid zou kunnen worden! Alsof het geen serieuze professie zou zijn.
Toch gaan we 28 maart bij de VOGIN-IP-lezing nog een stapje verder. In een workshop van maar twee uur maken we je specialist in text- en datamining …..
???
Nou okay, een specialist ben je dan misschien nog niet. Daarvoor is inderdaad veel meer tijd, inspanning en praktijkervaring nodig. Maar in de workshop van Hugo Benne maak je wel kennis met de basisprincipes en analysetools voor deze toepassing die ook voor informatieprofessionals steeds belangrijker wordt. Hugo vraagt deelnemers wel om thuis al wat voor te bereiden: software installeren en teksten lezen, zodat je 28 maart gedurende die twee uur meteen hands-on aan de slag kunt.

[Aanmelden vanaf 16 januari]