Lezingen 2021

vogin-ip-klein Sprekers bij de
VOGIN-IP-lezing
21 oktober 2021
Antal van den Bosch /Plenaire keynote/
Neurale taalmodellen: toekomst van de AI of goede goocheltruc?
Zeno Geradts /Plenaire keynote/
Automatisch herkennen van deepfakes [werktitel]
Jelle van Haaster 21ste eeuw vs. Defensie
Constant Hijzen Geheimen op het spoor. Archiefonderzoek naar inlichtingen- en veiligheidsdiensten
Lizzy Jongma Verbinden, bevinden, vinden: Linked Open Data om bronnen over de 2de Wereldoorlog op nieuwe manieren te presenteren en analyseren
Ilse Jonker Vindbaarheid en de Organisatie; hoe organisaties hun eigen vindbaarheid in de weg staan en wat je daaraan kan doen
Edgar Meij Search & Discovery for Finance – Zoekgedrag in de financiële wereld
Jerry Vermanen Hoe vind je data die niet gevonden wil worden?

Sprekers

Antal van den Bosch
Antal van den Bosch is directeur van het KNAW Meertens Instituut, en bijzonder hoogleraar taal en kunstmatige intelligentie aan de UvA. Na een opleiding als computerlinguïst in Tilburg deed hij promotieonderzoek bij Informatica in Maastricht. Hij was aan de universiteiten van Tilburg en Nijmegen hoogleraar taal- en spraaktechnologie. In zijn werk staan automatisch lerende systeme en, machine learning, centraal. Hij werkte met onderzoekers en programmeurs aan systemen voor automatische verwerking van (bijvoorbeeld Nederlandse) tekst, aan dialoogsystemen, automatische vertaalsystemen, en aan text mining-systemen met toepassingen in onder meer de zorg, media, en in andere takken van wetenschap. Als ‘klassieke’ onderzoeker van kunstmatige intelligentie gelooft hij niet in hypes, maar wel in de haalbaarheid van de doelstellingen die Alan Turing al in de jaren ’50 opstelde voor de AI.
| web | web | twitter | wikipedia | nrc | scholar | li | orcid |

Keynote-lezing: “Neurale taalmodellen: toekomst van de AI of goede goocheltruc?”
De grootste techbedrijven ter wereld troeven elkaar graag af met doorbraaktechnologie; op gezette tijden lanceert de één een massief grote computer en de ander een radicaal nieuw softwaresysteem, zoals IBM dat deed met DeepBlue en Watson. De aandacht wordt nu getrokken door taalgeneratiesystemen zoals GPT-3 (Generative Pre-trained Transformer, version 3, van het bedrijf OpenAI) die een nieuw niveau op het gebied van AI lijken te hebben bereikt. GPT-3 en soortgenoten (Google lanceerde onlangs MUM, voor de gewone stervelingen is er BERT) zijn in staat om tekst te laten volgen door een schijnbaar logische vervolgtekst, of dat nu een volgende uiting in een dialoog is, een antwoord op een vraag, of een informele parafrase van het voorafgaande. Arthur C. Clarke schreef het al: “Any sufficiently advanced technology is indistinguishable from magic”. Tijd om de magie te ontmaskeren. Transformers zijn knap, maar geen toverkunst en al helemaal geen oplossing voor algemene AI.
[Zie ook dit NRC-artikel]

Zeno Geradts
Zeno Geradts houdt zich bezig met digitaal forensisch onderzoek, in het bijzonder met methodes van data-extractie van digitale gegevensdragers tijdens of nadat een delict is gepleegd. Hij is hierin de verbindende schakel tussen het Nederlands Forensisch Instituut (NFI) en het Instituut voor Informatica van de UvA. Van belang is om te bepalen welk type bewijs kan worden verkregen uit de data in relatie tot het delict. Het doel is te komen tot forensisch verantwoorde methodologieën en oplossingen voor de verwerking van grote hoeveelheden data, en voor het bepalen van de bewijskracht (in de vorm van een likelihood ratio), rekening houdend met verschillende hypotheses en scenario’s. Uiteindelijk moet dit leiden tot grotere efficiëntie en kwaliteitswinst in het forensisch dataonderzoek waarin ook aandacht wordt besteed aan bewijskracht op activiteits-niveau.
Geradts werkt sinds 1992 als forensisch wetenschapper bij het NFI. Momenteel werkt hij op de afdeling Digitale Technologie en Biometrie, waar hij zich bezighoudt met beeldverwerking, camera-identificatie en biometrie. Geradts coördineert de R&D van verschillende projecten op het gebied van digitaal bewijs. Hij is voorzitter van de Forensic IT-werkgroep van de European Network of Forensic Sciences Institutes. Van 2010 tot 2013 was Geradts directeur van de Digital Evidence and Multimedia Section van the American Academy of Forensic Sciences. Van 2019-2020 was hij President van de AAFS. In samenwerking met UvA en NFI wordt het AI4Forensic ICAI Laboratorium opgericht waarin een onderzoekslijn deepfakes is.
| web | web | twitter | li | scholar | orcid |

Keynote-lezing: “Automatisch herkennen van deepfakes” [werktitel]
Het genereren van deepfakes wordt steeds makkelijker en we zien dat het ook in strafbare feiten wordt gebruikt, bijvoorbeeld om volwassenen in kinderpornofilms onherkenbaar te maken, of een niet bestaande identiteit te geven. In de rechtbank wordt geregeld geclaimd dat beelden niet echt zijn, en dan is het van belang om te kunnen bepalen of het beeld echt is of niet. Met behulp van kunstmatige intelligentie worden de beelden gegeneerd, maar kunnen ze ook worden gedetecteerd. Uiteraard moet er ook de gelegenheid zijn geweest om die beelden te maken. Een nieuw probleem is dat deepfakes nu ook real time kunnen worden gemaakt, waardoor de detectie en de chain of evidence lastiger worden. In deze presentatie wordt een overzicht gegeven van detectiemethoden, maar ook van nieuwe methoden van het genereren van deepfakes.
[zie ook dit bericht]

Jelle van Haaster
Jelle van Haaster (‘89) is militair, academicus en softwarespecialist. Tussen 2008 en 2012 rondde hij de militaire opleiding tot officier af, samen met de bachelor Krijgswetenschappen. In 2013 studeerde hij Public International Law en won hij de René Olthuisprijs voor zijn bachelorscriptie over datamining op sociale media. Van 2013 tot 2019 deed hij promotieonderzoek aan de Faculteit Militaire Wetenschappen en de Universiteit van Amsterdam. Naast zijn promotieonderzoek deed hij andere projecten zoals het integreren van digitale capaciteiten in Mali, het bouwen van apps voor Defensie en een levensreddende app voor de VN. In 2018 werd hij uitgeroepen tot Ambtenaar van het Jaar. Op 5 juli 2019 promoveerde hij op een onderzoek naar het nut van militaire cyberoperaties.
| web | boek | twitter | li | sem.scholar | NRC |

Lezing: “21ste eeuw vs. Defensie”
De maatschappij verandert snel. Waar een smartphone in 1998 nog gezien werd als “een mobiele telefoon? Wat moet ik daar nu mee?!” zijn we nu 22 jaar verder en is het een integraal deel van ons leven. De exponentiële acceptatie en adaptatie van technologie zoals smartphones en internet verandert een aantal cruciale onderdelen van onze samenleving.
Oorlogvoering is één van die onderdelen. Waarom zou je in de 21e eeuw nog fysiek naar een conflictgebied gaan als je iedereen over de hele wereld kunt bereiken zonder fysiek naar die persoon of groep toe te gaan? In deze presentatie gaat Jelle in op de veranderende maatschappij onder druk van digitale technologieën en de impact daarvan op de rol van de overheid en op de aard van conflicten in de 21e eeuw.
[Zie ook dit interview in NRC]

Constant Hijzen
Constant Hijzen is gepromoveerd op de Nederlandse inlichtingengeschiedenis. Centraal in zijn proefschrift stond de wederzijdse invloed die politiek, ambtenarij en samenleving op de Nederlandse veiligheidsdiensten uitoefenden in de twintigste eeuw. In zijn vervolgonderzoek duikt hij in het contraterrorismewerk door inlichtingen- en veiligheidsdiensten in de jaren zeventig van de twintigste eeuw. Momenteel is Constant nog verbonden als research fellow aan het Institute of Security and Global Affairs van de Universiteit Leiden.
| web | twitter | li | orcid | scholar | blog | podcast |

Lezing: “Geheimen op het spoor. Archiefonderzoek naar inlichtingen- en veiligheidsdiensten”
Archiefonderzoek doen naar geheime diensten is geen sinecure. Er lijkt zelfs sprake te zijn van een paradoxaal verschijnsel: enerzijds is er, van oudsher, een gebrek aan toegankelijk bronnenmateriaal. Geheim is immers geheim. Anderzijds zijn overheden sinds het einde van de Koude Oorlog ook grote delen van hun geheime archieven aan het openbaren. In sommige gevallen zelfs zo massaal dat de onderzoeker het overzicht verliest. In deze lezing zal ik ingaan op het doen van onderzoek naar inlichtingen- en veiligheidsdiensten. Ik schets de historische, historiografische en theoretische kaders en zal aan de hand van enkele praktijkvoorbeelden laten zien op welke manier dergelijk onderzoek toch zinvol kan zijn.

Lizzy Jongma
Lizzy Jongma is sinds 1 juni 2016 ICT-projectleider voor het Netwerk Oorlogsbronnen (NOB). Het Netwerk Oorlogsbronnen stimuleert het digitaal gebruik van erfgoed van de Tweede Wereldoorlog. Met behulp van Semantische Webtechnologieën en Open Data worden op de website oorlogsbronnen.nl worden ruim 11.000.000 gedigitaliseerde bronnen van archieven, musea, bibliotheken, herinneringscentra enzovoorts samengebracht en in samenhang toegankelijk gemaakt. En op de website oorlogslevens.nl worden archiefbeschrijvingen over ruim 350.000 oorlogsbetrokkenen gecombineerd om hun levens online te reconstrueren.
Lizzy Jongma is van huis uit Historicus. Zij heeft zich de afgelopen 25 jaar gespecialiseerd in de digitale ontwikkeling en online presentatie van Nederlands Erfgoed binnen musea en archieven (waaronder het Rijksmuseum).  Lizzy heeft in de Members Council van Europeana gezeten en is op dit moment Bestuurslid van Wikimedia Nederland.
| web | li | twitter | europeana |

Lezing: “Verbinden, bevinden, vinden: Linked Open Data om bronnen over de Tweede Wereldoorlog op nieuwe manieren te presenteren en analyseren”
Het Netwerk Oorlogsbronnen verzamelt gedigitaliseerd bronnenmateriaal over de Tweede Wereldoorlog in Nederland. Dit materiaal bevindt zich in vele honderden archieven, musea, bibliotheken en collecties. Het materiaal is op heel verschillende manieren, en voor heel verschillende doeleinden gedigitaliseerd en ontsloten.
Om dit materiaal zinvol, in samenhang en in context toegankelijk te maken voor een breed publiek gebruikt het NOB een heel scala aan technieken: Thesauri, Ontologieën, zoekstrategieën, Linked Open Data, scripts en crawlers. In deze presentatie neemt Lizzy jullie mee naar de achterkant van Oorlogsbronnen en Oorlogslevens en laat zien hoe verbinden en vinden van bronnen leidt tot nieuwe kennis en inzichten.

Ilse Jonker
Ilse Jonker is freelance contentstrateeg. Zij werkt sinds 1998 in de online wereld en heeft vele webprojecten, contentmigraties en -transformaties geleid. Sinds 2006 helpt zij als onafhankelijk adviseur grote organisaties bij het zo effectief mogelijk inzetten van content. Haar specialisaties: contentstrategie, contentmanagement, contentmodellering, contentarchitectuur, content design, metadata en online governance. Haar modus operandi: verbinden en vertalen. Tussen een organisatie en de doelgroepen die zij wil bereiken. Tussen verschillende bedrijfsonderdelen: communicatie, marketing, business en IT, tussen informatieprofessionals, vormgevers en ontwikkelaars en bovenal: tussen mensen en data.
| web | twitter | li |

Lezing: “Vindbaarheid en de Organisatie; hoe organisaties hun eigen vindbaarheid in de weg staan en wat je daaraan kan doen”
Als contentmensen en informatieprofessionals kennen we de waarde van informatie. We onderzoeken, structureren, optimaliseren en metadateren, alles om vindbaarheid te vergroten. Maar…hoe komt het toch dat ondanks al die inspanningen als voorvechters van vindbaarheid we niet de resultaten boeken die we voor ogen hadden? Dan blijkt: onze grootste uitdaging is niet de content. De grootste blokkade voor vindbaarheid is organisatiecultuur en -politiek. Ilse neemt jullie mee op safari: hoe organisaties hun eigen vindbaarheid frustreren en hoe je ondanks gedoe toch de beste resultaten kan behalen.

Edgar Meij
Edgar Meij is the head of the Artificial Intelligence (AI) Discovery group in Bloomberg’s Engineering department. He leads several teams of researchers and engineers who develop systems that provide question answering capabilities, smart contextual suggestions with severe latency constraints, as well as the Bloomberg Knowledge Graph with its advanced machine learning-based analytics that is used to generate accurate, timely, and contextual financial insights. Edgar holds a PhD in computer science from the University of Amsterdam and has an extensive track record in information retrieval, natural language processing, and machine learning. Before joining Bloomberg, Edgar worked at Yahoo! Labs on all aspects related to entities in the context of web search.
| web | twitter | videolect | li | scholar | slides |

Lezing: “Search and Discovery for Finance – Zoekgedrag in de financiële wereld”
Finance professionals face a myriad of tasks in their day-to-day workflows, including finding relevant information, generating trade ideas, staying up to date with breaking news or general trends in the world, and coming up with novel ways to generate “alpha”. Historically, this has centered mainly around traditional sources of data such as stock exchange ticks, news stories, company filings, etc. An increasing amount of data is being generated in textual form on social media and elsewhere, however, and given the simultaneous increase in more machine-readable forms of “alternative data” such as web site usage, credit card transactions, and mobile app analytics, we face a unique opportunity to identify, score, rank, suggest, filter, and alert to financially relevant information and events. In this talk, Edgar describes typical information needs of finance professionals and how Bloomberg uses techniques such as search, summarization, entity linking, and natural language understanding & generation to address those needs.
[lezing in het Nederlands]

Jerry Vermanen
Jerry Vermanen werkt als datajournalist bij de datajournalistieke onderzoekswebsite Pointer (KRO-NCRV). Hij ontmaskerde directeuren die miljonair zijn geworden van zorggeld, confronteerde downloaders van kinderporno met data en slimme zoektechnieken, en werkte samen met Bellingcat en Lighthouse Reports om Nederlandse wapens in conflictgebieden te ontdekken. Recent onderzocht hij een Nederlands trollenleger dat desinformatie over covid-19 vaccins verspreidt en coördineert. Daarnaast schreef hij samen met Andrew Dasselaar het Handboek Internetresearch & Datajournalistiek.
| web | twitter | blog | nieuwsbrief | boek |

Lezing: “Hoe vind je data die niet gevonden wil worden?”
Je zoekt datasets voor je volgende briljante project, maar waar je ook zoekt: nergens vind je wat je nodig hebt. Datajournalist Jerry Vermanen (Pointer, KRO-NCRV) deelt een aantal van zijn tips en truuks om data te vinden die niet gevonden wil worden. Heb je al een persoonlijke alarmeringsdienst opgezet voor specifieke datasets? Of wil je weten hoe je het verwerken van data kunt crowdsourcen? Na deze lezing kun je dat geplande onderzoeksproject toch nog afronden.

vogin-ip-klein