Informatie over
sprekers en lezingen bij de
VOGIN-IP-lezing 28 maart 2018

Joseph Busch	/Plenaire keynote/ AI vs. Automation – The Current State of Automated Content Tagging
Maarten Dammers	Wikidata; wat kun je ermee; hoe voeg je zelf data toe?
David Graus	Zoeken, vinden, en aanbevelen: personalisatie vs. privacy
Laura Hollink	Detecteren van veranderingen in de betekenis van woorden en concepten
Arno Reuser	Gaat u maar rustig slapen, er is niets aan de hand
Rein Tellier & Elwin de Man	Forensische OSINT : implementatie en operationalisering van een nieuwe methode van zoeken en vinden
Suzan Verberne	Automatische classificatie van teksten
Ruben Verborgh	/Plenaire keynote/ Linked Data, Blockchain en andere epische sagen

Sprekers

Joseph Busch
Mr. Busch is the Founder and Principal Consultant at Taxonomy Strategies. For the past 14 years Taxonomy Strategies has been guiding organizations such as Deloitte, the Center for Medicare and Medicaid Services, and the Robert Wood Johnson Foundation in developing frameworks that help improve information capture, preservation, search, retrieval, and governance.
Mr. Busch has just started a new company called Semantic Staffing, a recruiting service for information management professionals.
Before founding Taxonomy Strategies Joseph Busch was:
• Vice President for Infoware at Metacode Technologies which was an early developer of commercial semantic technology applications based on latent semantic indexing (LSI) and other methods. Metacode was acquired by Interwoven in 2000.
• The Getty’s Program Manager for Standards and Research Databases, including the Getty Vocabulary Program from 1993-98. The Getty began publishing the vocabulary resources as linked open data in 2014.
Mr. Busch is a past President of the Association for Information Science and Technology, and past member of the Dublin Core Metadata Initiative Executive Committee.
| web | twitter | li |

Lezing: “AI vs. Automation – The Current State of Automated Content Tagging”
Some technologies like IBM Watson are being touted as artificial intelligence or AI. In response, there are new AI offerings from the large enterprise software companies as well as many start-up companies. But is this AI or automation? This talk discusses the difference and argues that these offerings use natural language processing, entity extraction and complex Boolean queries rather than AI, and that machine learning operates in much the same way as crowd sourcing and can be subject to the tyranny of the mob. These automation technologies have been available for a long time, what’s changed so that now they have so much mind share? This talk argues that software as a service offerings (SAAS) and the internet of things (IOT) are some of the important drivers of interest in AI technologies.
There are real opportunities to use this technology to automate content tagging, and there are real dangers that automated content tagging will sometimes inappropriately promote and obscure content. We’ve all heard talks about AI, but little detail about how these applications actually work. Recently I’ve been working with clients to explore the current state of the art of so-called AI technology, and to trial several of these tools with research, policy and general news content. In addition to framing the debate about whether this is AI or automation, this talk will describe how to run trials with these tools, and will show some results from actual trials.
[zie blogpost]

Maarten Dammers
Maarten Dammers is vrijwilliger van Wikimedia, de organisatie achter onder andere Wikipedia en Wikidata. Hij is al meer dan 10 jaar actief en één van de oprichters van Wiki Loves Monuments, de grootste foto wedstrijd ter wereld. Maarten houdt zich op dit moment voornamelijk bezig met “Sum of all Paintings”, een project met als doel om alle (relevante) schilderijen op Wikidata te documenteren.
Maarten werkt in het dagelijks leven als netwerk expert bij een ICT Service Provider in Amsterdam
| twitter | li | slides |
.
Lezing: “Wikidata; wat kun je ermee; hoe voeg je zelf data toe?”
Als je op zoek bent naar informatie over een onderwerp dan zullen de meeste mensen eerst op Wikipedia kijken om zich te oriënteren. Op Wikipedia vind je dan weer links naar bronnen om verder te verdiepen. Wikidata is 5 jaar geleden begonnen als centrale plek om onderwerpen in verschillende taal versies van Wikipedia aan elkaar te koppelen, maar is in de tussentijd veel meer dan dat geworden. Wikidata is een vrij bewerkbare database van gestructureerde data (Linked Open Data). Deze data wordt onderbouwd met bronnen. Ik zal de concepten van Wikidata uitleggen, hoe je wat kan toevoegen (met een bron) en hoe je de data kan doorzoeken. Daarnaast zal ik een aantal tools laten zien die gebruikt worden om Wikidata te verbeteren.
[zie blogpost]

David Graus
David Graus werkt als datawetenschapper bij de FD Mediagroep, waar hij voorspellende modellen en algoritmen inzet rond financiële en nieuwsdata. In 2017 verdedigde hij met succes zijn proefschrift [PDF], en behaalde een PhD in zoekmachinetechnologie aan de Universiteit van Amsterdam. Zijn onderzoek richtte zich op het doorzoekbaar en inzichtelijk maken van (grote hoeveelheden) digitale sporen en tekstdata.
| web | twitter | li | slides |
.
Lezing: “Zoeken, vinden, en aanbevelen: personalisatie vs. privacy”
Tegenwoordig kijkt men steeds vaker met argusogen naar technologiebedrijven die op grote schaal gebruikersgedrag verzamelen. In dit praatje zet ik uiteen waarom het inzetten van gebruikersgedrag van belang is, en hoe het wordt gebruikt om informatie effectief te kunnen ontsluiten en doorzoekbaar maken, of het nu gaat om een zoekmachine als Google, die zich een weg moet banen door een web van miljarden pagina’s, of een service als Spotify, die haar gebruikers graag de juiste muziek blijft aanbieden.
[zie blogpost]

Laura Hollink
Laura Hollink is onderzoeker bij het Centrum Wiskunde & Informatica. Zij is in 2006 gepromoveerd aan de Vrije Universiteit Amsterdam op het gebruik van Semantic Web technieken voor het zoeken naar beeldmateriaal. Sindsdien werkt zij aan de combinatie van formele kennismodellen met statistische analyse van het gebruik van data. Kennismodellen worden, bijvoorbeeld, gebruikt in zoekmachines; denk aan de thesaurus van een bibliotheek of de ‘Knowledge Graph’ van Google. Door de logica van deze formele modellen te combineren met de rijke variatie en dynamiek die we zien in het gebruik van data, proberen we zowel de kennismodellen als de zoekmachines te verbeteren. Laura’s onderzoek heeft geresulteerd in interdisciplinaire samenwerkingen met de Koninklijke Bibliotheek, het Nederlands Instituut voor Beeld en Geluid, Yahoo!, met historici, taalwetenschappers, communicatiewetenchappers en politicologen.
[CWI Information Access Group – video]
| web | web | twitter | li | video | slides | scholar |
.
Lezing: “Detecteren van veranderingen in de betekenis van woorden en concepten”
De betekenis van concepten verandert met de tijd. Bijvoorbeeld: “wetenschap” heeft niet meer de sterke link met religie die het in de middeleeuwen had, “allochtoon” begon als een neutraal woord maar is dat al tijden niet meer, “genderdysforie” wordt niet langer bestempelt als een ziekte.
Deze veranderingen hebben gevolgen voor allerlei toepassingen van text mining. Het bemoeilijkt de classificatie van documenten en het interpreteren van zoekvragen van gebruikers. Het beperkt ook de interoperabiliteit tussen zoeksystemen met collecties uit verschillende periodes. In deze lezing zal ik laten zien hoe we automatisch kunnen detecteren dat een concept veranderd is met de tijd, zodat applicaties hier rekening mee kunnen houden. We kijken hiervoor naar het voorkomen van woorden in grote hoeveelheden tekst. De aanname is dat de manier waarop een woord gebruikt wordt informatie geeft over de betekenis van het concept waar het bijhoort. Een gedetecteerde verandering in gebruik kan dus wijzen op een verandering in betekenis.
In recent werk hebben wij deze methode toegepast om de mate van verandering te bepalen van concepten in een thesaurus. Ik zal laten zien hoe we hiermee inzicht krijgen in verandering van hele categorieen van concepten. Bijvoorbeeld: welke concepten zijn meer veranderd in de afgelopen tweehonderd jaar, die gerelateerd aan emoties of aan etenswaren? En welke emotie is eigenlijk het meest veranderd?
[zie blogpost]

Arno Reuser
Oprichter en eigenaar van Reuser’s Information Services, een bedrijf gespecialiseerd in Open Source Intelligence (OSINT) consultancy en trainingen, zoekstrategieen voor dieptezoeken. Eerder was hij 25 jaar verbonden aan de Militaire Inlichtingen- en Veiligheidsdienst als oprichter, manager en hoofd Open Source Intelligence. Arno spreekt, schrijft, is gastdocent aan diverse universiteiten, programmeert, begeleidt, en verzorgt wereldwijd open en in-house trainingen OSINT aan (semi) overheden en internationale missies.
| web | twitter | G+ | li |
.
Lezing: “Gaat u maar rustig slapen, er is niets aan de hand”
Ons land is nu meerdere malen opgeschrikt door aanvallen met zogenaamde ‘ransomware’, met ernstige gevolgen en voor betrokkenen miljoenenschade, maar toch lijken de meesten zich er niets van aan te trekken. Ook voor IP-ers kan cybercrime ernstige gevolgen hebben, bijvoorbeeld als een vertrouwelijk online onderzoek zoveel informatie prijs geeft dat de informatiepositie beschadigd wordt. Of als individuen onbewust zoveel over zichzelf prijs geven dat er misbruik van gemaakt kan worden. Of als IP-ers niet in staat zijn de minimum tests toe te passen om fake-informatie te identificeren en cybercrime te voorkomen. De lezing laat een aantal echte cybercrime gevallen zien, legt uit wat de meest voorkomende gevallen van cybercrime zijn, hoe het werkt en hoe dat IP-ers raakt. Besloten wordt met een aantal belangwekkende bronnen.

Rein Tellier
Rein Tellier is Coördinator internetsurveillance bij OSINT Noord Holland. Sinds 1996 is hij werkzaam bij de politie. Daar was hij onder andere traangasschutter bij de ME, maakte hij deel uit van het Horeca Interventie Team en fungeerde hij als praktijkcoach. In 2009 is hij in het toenmalige project Internetsurveillance binnen de Informatieorganisatie gestapt. Vanuit die situatie heeft hij opgebouwd hoe nu in Noord Holland als OSINT gewerkt wordt. Vanuit OSINT ontwikkelt hij landelijke OSINT-opleidingen, is hij deelnemer aan het landelijk OSINT-coördinatorenoverleg en is hij voorzitter van de landelijke kenniskring OSINT.
.

Elwin de Man
Elwin de Man is sinds 2005 in dienst bij de politie. Als surveillant en als biker op de mountainbike heeft hij diensten gedraaid in de Zaanstreek en Waterland. Sinds 2011, na een dienstongeval, is hij aan de slag gegaan met Internet-surveillance. Hij heeft al vrij snel aangehaakt bij Rein Tellier die toen werkzaam was in Noord Holland Noord. Elwin is vooral aktief met advisering in monitoring bij grootschalige politie inzetten en lokale problematiek. Hij heeft vorm gegeven aan opleidingen voor collega’s en vervult een adviserende rol in verschillende projectgroepen.
.
Lezing: “Forensische OSINT : implementatie en operationalisering van een nieuwe methode van zoeken en vinden”
OSINT (Open Source Intelligence) is een methode voor het doen van gespecialiseerd systematisch onderzoek in open bronnen zoals het Internet en sociale media. Een strakke en goede organisatie van de werkzaamheden is daarvoor een vereiste. Voor de Nationale Politie is OSINT een belangrijk hulpmiddel voor forensisch onderzoek. Teneinde OSINT optimaal te kunnen inzetten werd – specifiek voor de Nuclear Security Summit in 2014 – in dat zelfde jaar een OSINT opleiding afgerond. Die opleiding heeft geleid tot het herinrichten en structureren van het OSINT proces binnen de politie eenheid. De lezing legt uit welke stappen er doorlopen moeten worden tot het OSINT eindproduct, de organisatie van OSINT maar ook hard- en software eisen, veilige verbindingen en tools.
[zie blogpost]

Suzan Verberne
Suzan Verberne is Universitair Docent bij het informatica-instituut van de Universiteit Leiden en is van daaruit betrokken bij het interdisciplinaire Data Science onderzoeksprogramma. Ze promoveerde in 2010 aan de Radboud Universiteit op het gebied van slimme zoeksystemen en werkt sindsdien aan problemen op het gebied van text mining en informatie-ontsluiting. Ze was betrokken bij projecten in een groot aantal toepassingsdomeinen met veel verschillende doelgroepen – van kunsthistorici tot patiëntenorganisaties en van archeologen tot fysiotherapeuten. Ze werkt samen met uiteenlopende publieke en private partners zoals Sanoma, YoungCapital, het Ministerie van Financiën, RIVM, Hogeschool Codarts, KankerNL en de Koninklijke Bibliotheek.
[Over Suzan Verberne in De Volkskrant]
[College bij de Universiteit van Nederland – video]
| web | twitter | li | slides | scholar |
.
Lezing: “Automatische classificatie van teksten”
In deze lezing zal ik vertellen hoe de automatische classificatie van teksten helpt bij het vinden van relevante informatie, op het web en in specialistische archieven. Ik zal beginnen met een aantal voorbeelden van tekstclassificatie die u waarschijnlijk allemaal kent. Denk maar aan spamdetectie, de indeling van nieuwsberichten naar onderwerp en het toekennen van trefwoorden aan archiefstukken. Daarna zal ik uitleggen hoe technieken voor tekstclassificatie werken, wat er nodig is om automatische classificatie van teksten te realiseren en hoe deze methoden geëvalueerd kunnen worden. Tot slot zal ik wat suggesties doen waarmee u de beschreven technieken in de praktijk kunt brengen.
[zie blogpost]

Ruben Verborgh
Ruben Verborgh is professor semantisch-webtechnologie bij de Universiteit Gent, en volgt Linked Data en webarchitectuur al jaren op de voet. Hij specialiseert in decentralisatie van het web door middel van slimme clients, en was recent gastonderzoeker bij het Massachusetts Institute of Technology rond dit topic. Zijn onderzoek opent nieuwe perspectieven rond de schaalbaarheid en toepassing van het Semantisch Web.
| web | blog | twitter | li | slides | scholar |

Lezing: “Linked Data, Blockchain en andere epische sagen”
Zoals vaak gebeurt bij hypes, wordt blockchain plots overal bij betrokken – ongeacht of het nu steek houdt of niet. In deze lezing leg ik uit wat blockchain is en wat mogelijke toepassingen zijn. We bekijken hoe blockchain een nuttige rol kan spelen voor Linked Data en vice-versa, en welke mogelijkheden er aankomen voor informatieprofessionals. Op die manier wordt het verschil tussen feiten en fictie duidelijk, en kunnen we in klare taal discussiëren over blockchain-technologie.
[zie blogpost]