11 mei


Gisteren waren 175 deelnemers getuige van een succesvolle 10de aflevering van de VOGIN-IP-lezing. Dat waren al weer wat meer bezoekers dan bij het vorige evenement, vorig jaar oktober. Maar aan de pre-corona aantallen kwamen we daarmee toch nog niet.

Als organisatoren waren we dit keer zelf ook weer aangenaam verrast door de kwaliteit van veel van de lezingen. Het organiserend en uitvoerend team op de foto hierboven, ziet er aan het eind van de dag dan ook tevreden uit. Maar ook als we op de reacties van de bezoekers afgaan, hebben de thuisblijvers echt weer wat gemist.

De presentaties van bijna alle sprekers en van een paar van de workshops staan intussen al op deze website. Meer zal binnenkort nog volgen. Ook hebben we de gisteren verstuurde tweets al verzameld. En verder staan op die terugblikpagina al een paar foto’s. Maar het wachten is natuurlijk op de officiële congresfoto’s die we zo spoedig mogelijk zullen proberen te publiceren.

We zien jullie morgen

Voordat de bezoekers van de tiende VOGIN-IP-lezing morgen in alle vroegte naar de OBA afreizen, hebben we voor hen nog een paar mededelingen.

  • De meesten zullen de OBA, de Openbare Bibliotheek Amsterdam wel kennen. Zo niet: het is op het Oosterdokseiland, 5 à 10 minuten lopen oost van het Centraal Station. Kijk zonodig nog even op Google Maps; via https://tinyurl.com/OBA-voginip kom je virtueel al op de goede plek uit.
    De OBA is goed bereikbaar met openbaar vervoer. Wie niettemin met de auto wil komen, vindt nadere informatie op de site van de parkeergarage die zich naast/onder de OBA bevindt. Daarop staan de huidige aanrijroutes duidelijk aangegeven; sommige vroegere routes zijn af en toe door werkzaamheden geblokkeerd. Het is ook goed te weten dat (iets verder weg) de Piet Heintunnel voor alle verkeer is afgesloten.
  • We beginnen al vroeg. De eerste lezing start om 9:45 uur. Zorg dus dat je tijdig aanwezig bent.
    Het is het handigst om met lift of roltrap naar de 6de etage te gaan en daar de trap naar het theater te nemen. Om de aanmelding wat te stroomlijnen, splitsen we de deelnemers halverwege die trap op alfabet: A-K en L-Z. Bovenaan die trap kun je je badge en verdere paperassen ophalen en vast een kopje koffie nemen.
  • Kijk thuis nog even voor welke workshop(s) en/of lezingentrack(s) je hebt ingeschreven. Omdat een aantal workshops is volgeboekt, is het niet mogelijk daar nog van af te wijken. Het definitieve programma vind je op onze website. Daar vind je ook links naar plattegronden waarop is aangegeven waar de workshoplocaties zich bevinden. Bij inschrijving ontvang je trouwens ook nog een gedrukt programmaboekje waar die plattegronden in staan.
  • In de foyer op de 7de etage is geen bewaakte garderobe. Wel staan er garderoberekken.
  • Er is Wifi bij de OBA. Je kunt je laptop of tablet dus meenemen. Voor het meedoen aan de meeste workshops is eigen apparatuur zelfs onontbeerlijk. En verder kun je natuurlijk je aantekeningen rechtstreeks in de cloud maken en via sociale media ervaringen uitwisselen met andere deelnemers of met thuisblijvers.
    Er is al een hashtag #voginip afgesproken. Lekker kort, zonder jaartal, omdat het vanzelfsprekend is dat het nu om de aflevering van dit jaar gaat.
  • In de pauzes kun je op de 7de etage voor koffie en thee terecht en kun je de stands (=tafels) van onze sponsoren bezoeken. De lunch wordt ook in die ruimte en op de 6de etage geserveerd.
  • Na afloop van het programma bieden we je nog een borrel met hapjes aan, om daarbij na te praten, te netwerken en deze 10de jubileumeditie te vieren. Loop na de laatste spreker dus niet meteen weg. En laat het thuisfront ook weten dat het iets later kan worden, want we mogen tot 7 uur blijven.

En realiseer je je nu ineens dat je je helemaal niet hebt aangemeld voor deze fantastische dag? Dat kan vandaag gelukkig nog steeds. Alleen zul je dan woensdag genoegen moeten nemen met een handgeschreven deelnemersbadge.

Al 2x bij NPO-OP1, a.s. woensdag live bij VOGIN-IP


Altijd leuk als een voor VOGIN-IP geboekte spreker ineens ook op TV verschijnt. Eerder gebeurde dat met Christiaan Triebert, nu is de beurt aan Knack-factchecker Brecht Castel. Al twee keer mocht hij vorige maand bij NPO-OP1 aanschuiven om te vertellen over zijn factchecking-activiteiten, vooral met betrekking tot (nep)nieuws over Oekraïne ([8 april], [26 april]). Op TV is natuurlijk leuk, maar Brecht a.s. woensdag live horen vertellen is nog veel leuker. Want dan krijgt hij veel ruimer de tijd (40 minuten) om iets van zijn methoden te laten zien en bovendien kan hij daar niet worden onderbroken door eigenwijze presentatoren en andere gasten.

Naar zo’n live lezing zitten luisteren is natuurlijk fantastisch, maar zelf doen is zeker zo leuk. Daarom zijn we blij dat je ook actief met factchecken aan de gang kunt in de workshop van Leon Pauw. Hij is factchecker voor het Leidse Nieuwscheckers en vervangt in deze workshop onze reguliere docent Alexander Pleijter die onverwacht verhinderd was.

Woensdag is natuurlijk kort dag, maar aanmelden kan nog tot uiterlijk dinsdagavond (wel hoe eerder, hoe fijner voor de organisatoren). En je kunt het ook nog combineren: in het ochtendprogramma naar Brecht, in de middag naar Leon’s workshop.
Zien we je woensdag?

 
aanmelden
 

De 10de VOGIN-IP-lezing – een terugblik op de vorige negen (4)

Deel 4: Covid-19 gooide roet in het eten 2020-2021


2020 leek een jaar als vele voorgaande te worden. Het programma was op tijd klaar en zag er prima uit. Een week voor de geplande datum van 19 maart waren ook al 250 deelnemers geregistreerd. Maar we weten intussen allemaal dat net op dat moment de eerste strenge regels vanwege de Covid-19 pandemie werden afgekondigd en dat dus ook dit evenement moest worden afgeblazen. Dat kwam natuurlijk al niet meer echt onverwacht, want we verkeerden al enige tijd in onzekerheid. Zo hadden twee sprekers die uit het buitenland moesten komen, al wat eerder afgezegd. Maar daarvoor hadden we heel optimistisch zelfs nog vervangers gevonden.
Toen duidelijk was dat er geen sprake zou zijn van een kortdurend uitstel, werd besloten een aantal van de geplande lezingen en workshops, gespreid over het jaar, online via Zoom aan te bieden. Verder werden enkele van de resterende sprekers en veel van de workshops alsnog voor het programma van 2021 geboekt.

Deelnemers die al betaald hadden kregen de keuze dat geld gecrediteerd te krijgen of het te laten staan voor deelname in 2021. Dat resulteerde ongeveer in een 50/50 verdeling. Van degenen die geen geld teruggevraagd hadden, hebben uiteindelijk ruim 40 mensen het congres in 2021 toch niet bezocht. Voor de online activiteiten (zowel lezingen als workshops) werd uit coulance tegenover de vele vaste bezoekers geen inschrijfgeld gevraagd.

Klik op image om DWDD-video fragment te starten

Hoogtepunt van het Zoom-programma was de keynote door Christiaan Triebert “Visual Investigations en The Cockpit Tapes”. In november 2019 hadden we al volop reclame gemaakt voor de oorspronkelijk voor 19 maart geplande lezing, nadat Christiaan een deel van zijn verhaal ook al in DWDD had mogen vertellen. Uiteindelijk kwam die keynote er alsnog op 26 mei via Zoom. Helaas was toen het aantal kijkers – 96 – veel minder dan de 250 die live in maart aanwezig hadden zullen zijn.
Christiaan was intussen werkzaam voor het Visual Investigations Team van de New York Times. Zijn lezing ging onder meer over de analyses van de “cockpit tapes” – de opnames van gesprekken tussen Russische straaljagerpiloten in hun cockpit en het centrale commandocentrum, tijdens bombardementsvluchten waarbij Syrische ziekenhuizen werden bestookt.

Christiaan was al ruim voor het congres vanuit New York in Nederland aangekomen – dus voordat de toegang tot de meeste landen dichtging. Door ons toedoen heeft hij daardoor zijn werk voor de NYT vele maanden vanuit het huis van zijn ouders in Friesland moeten doen. In het korte interview dat aan zijn lezing voorafging, kwam ook dat onder meer ter sprake. Hoe hij in Friesland de tijd doorbracht kwam uitgebreider aan de orde in het mooie gesprek op NPO Radio-1 dat hij 2 juni had met Pieter van der Wielen in het nachtprogramma “Nooit meer Slapen”. Nu hij toch in Nederland was, trad hij ook op in de talkshow Op1.

Van de andere drie online lezingen zijn ook videoregistraties beschikbaar. Op 11 juni was Andreas Blumauer aan de beurt, met 44 deelnemers voor “Deep Text Analytics based on Knowledge Graphs”. Op 25 september sprak Laura Hollink voor 35 kijkers over “How to make knowledge graphs work for humans?“. En op 8 oktober gaf Bianca Kramer de laatste lezing voor 54 kijkers over “Metadata – bouwstenen van open wetenschap“.
Van de workshops zijn, in verband met de privacy van de deelnemers geen videoregistraties bewaard. In het voorjaar verzorgde Joyce van Aalten op 18 en 28 mei een workshop “Maak je eigen Infographic” met 19 en 25 deelnemers. Op 3 juni gaven Jeroen Bosman en Bianca Kramer een workshop met de lange titel “Verkennen van de research frontier: hoe vind en beoordeel je posters, presentaties, preprints en proposals?” met 28 deelnemers.
In het najaarsprogramma was 22 september Marlies Segers van LexisNexis aan de beurt met “De strijd om de lijsttrekkers in aanloop naar de verkiezingen van 2021”. Op 30 september en 14 oktober tenslotte Arno Reuser met “Smart Queries for Smart Searching: online course in the best Boolean search techniques” met respectievelijk 20 en 22 deelnemers. Voor deze workshops waren de aantallen deelnemers hoger dan bij de live-sessies gebruikelijk (en mogelijk) was.
 .

 .
Tijdens deze Covid-periode werden we nog opgeschrikt door het trieste bericht dat Hugo Benne, als tweede VOGIN-IP docent in betrekkelijk korte tijd, uit het leven gestapt was.
 .
.
.

Naschrift:
Begin dit jaar werd het organiserende team aangevuld met Will Roestenburg.
Aan het eind van het jaar nam het team afscheid van Joyce van Aalten, Arno Reuser en teamlid van het eerste uur Peter Evers.
Hoewel formeel geen lid van het team, heeft Ronald de Nijs in zijn tijd als eindredacteur van IP, van de eerste editie tot begin 2020, steeds gezorgd voor waardevol advies, assistentie en (via het blad) publiciteit.

 


 


In 2021 was het nog altijd geen business as usual. Ondanks de goede voortgang met de vaccinaties, bleven aanvankelijk beperkingen en lockdowns van kracht. Van een VOGIN-IP-lezing in de gebruikelijke periode in maart kon dus zeker nog geen sprake zijn. Van de twee bij de OBA gereserveerde data na de zomer hebben we na lang wikken uiteindelijk de laatste, in eind oktober, gekozen. Dat bleek (toevallig) een gouden greep, want dat was net nadat beperkingen van zaalbezettingen waren komen te vervallen en net voordat weer nieuwe beperkingen ingingen. Bij de ingang van de OBA moesten deelnemers nog wel hun Corona QR-code laten zien, die daar ter controle gescand werd.
Ondanks een flink aantal deelnemers dat het jaar tevoren al betaald had, bleef de verdere inschrijving beperkt, doordat er kennelijk wel wat Corona-angst heerste. We kwamen uiteindelijk uit op 155 bezoekers. Daarmee leden we, gecombineerd over de twee jaren 2020-2021, toch nog net geen verlies.
Een paar sprekers hadden we nog staan uit het afgelaste programma, maar die moesten nog wel opnieuw bevestigen. Daardoor konden we wel in mei al melden dat de eerste spreker had toegezegd. Maar er was meer nodig en voor de keynote lezingen moesten sowieso nieuwe sprekers gevonden worden, omdat we de oorspronkelijke al online hadden opgebruikt. Het VOGIN-IP-team vergaderde daarvoor nog altijd via Zoom.
Ondanks de korte voorbereidingstijd die na de zomervakantie nog resteerde, lukte het prima om het programma vol te krijgen.
Eerste keynote was van Zeno Geradts van het Nederlands Forensisch Instituut, met een lezing over het herkennen van deep-fake beeldmateriaal. Hoewel dat onderwerp wel al leefde in onze doelgroep werd het extra actueel nadat ook Arjen Lubach (op zondag) een item aan deep fakes gewijd had.
De tweede keynote lezing werd verzorgd door Antal van den Bosch en was gewijd aan de nieuw ontwikkelde zogenaamde taalmodellen die op basis van onvoorstelbaar omvangrijke tekstcorpora en door toepassing van kunstmatige intelligentie op slimme manieren tekst kunnen genereren. Antal opende zijn lezing met een portret van Alan Turing, die aan de basis van AI gestaan had. Vervolgens plaatste hij wel enige kritische kanttekeningen bij de claims van de moderne taalmodellen zoals BERT en GPT-3. Overigens meldde NRC een dezer dagen dat satirisch nieuwsplatform “De Speld” in première ging met een theatershow die ze mede hadden laten schrijven door het GPT-3 algoritme.
Als voorbereiding op de VOGIN-IP-lezing publiceerde IP nog een soort dubbelinterview met de beide keynote sprekers
Nog even terug naar de zojuist genoemde “eerste” toezegging. Die was van Jelle van Haaster, die een positie als militair combineert met eentje als wetenschapper. Zijn gepassioneerde verhaal ging heel open in op het belang van digitale informatie voor het leger, waar “cyber” nu een geaccepteerde vierde pijler vormt naast land-, lucht- en zeemacht.
Andere sprekers waren Ilse Jonker over de wijze waarop de cultuur binnen organisaties de vindbaarheid van hun informatie beïnvloedt en Constant Hijzen over archiefonderzoek dat hij gedaan had naar inlichtingen- en veiligheidsdiensten. Bij deze lezing leken we even terug in corona-tijden, want om medische redenen moest Constant zijn lezing vanaf huis geven, zodat de deelnemers in de zaal toch weer naar een – wel heel groot – Zoom-scherm zaten te kijken. Onverwachte onvolkomenheid was dat Constant door een technisch manco bij de OBA niet kon horen wat vanuit de zaal gezegd en gevraagd werd.
Verder kwamen Lizzy Jongma (Netwerk Oorlogsbronnen), Edgar Meij (Bloomberg) en Jerry Vermanen (Pointer) nog aan het woord. Jerry, ook auteur van het “Handboek Internetresearch & datajournalistiek” kreeg in de evaluatie de hoogste beoordeling van alle sprekers.

We hadden dit jaar iets minder workshops dan andere jaren. Achteraf niet zo erg nu er ook minder deelnemers waren. Daar was overigens wel weer een aantal helemaal nieuwe workshops bij. Egon Willighagen leerde je werken met Scholia en WikiCite, tools die op Wikidata gebaseerd zijn en waarvoor we vorig jaar – met vooruitziende blik – al publiciteit gemaakt hadden met het Covid-19 virus als voorbeeld.

NeesJan van Eck gaf een introductie op gebruik van VOSviewer, een open source visualisatie-tool voor wetenschappelijke netwerken. Erik Elgersma – in 2015 al present met een lezing – baseerde nu een workshop op zijn eigen ervaringen met het opzetten van een zelfstandige informatiedienst.
Met Frank Huysmans kon je data-analyses leren maken met een paar open source software pakketten. Joyce van Aalten bracht haar workshop over het maken van Infographics, die vorige jaar via Zoom in première was gegaan, nu voor het eerst live.

Klassiekers waren dit jaar alleen de workshops van Guus van den Brekel & Robin Ottjes, die van Ewoud Sanders (Slimmer zoeken in Delpher was na een paar jaar weer terug) en Alexander Pleijter (Factchecking). In de blogpost die we daaraan wijdden, bleek de factcheck-spreker voor 2022 – Brecht Castel – overigens ook al genoemd te worden.

Dat de lezing van Constant Hijzen via Zoom plaatsvond, illustreerde nog weer eens de beroemde uitspraak “elk nadeel hep ze voordeel”. In verband met de Zoom-sessie was bij het begin van de dag de videoregistratie in de theaterzaal namelijk meteen al aangezet (en niet meer uitgezet). Daardoor werden we enkele dagen na het congres verrast met een bericht van SURF dat we vanaf hun server een videoopname met alle lezingen voor eigen gebruik konden downloaden. Er was maar één spreker die, in verband met zijn werkgever, uiteindelijk geen toestemming kon geven zijn lezing publiek beschikbaar te stellen. De andere zeven zijn – met deeplinks naar de afzonderlijke beginpunten – nog op YouTube terug te kijken. Een unicum in onze historie.

Na de evaluatie van deze editie van de VOGIN-IP-lezing, hebben we de resultaten van de evaluaties van alle negen jaargangen eens bij elkaar geharkt en de cijfers die deelnemers hadden gegeven aan lezingen en workshops in een tabelletje naast elkaar gezet. Alleen van het eerste jaar – 2013 – bleken die cijfers er niet te zijn. Dat overzicht stemde ons wel tevreden want er zijn weinig negatieve uitschieters en het laatste jaar kreeg bijna overal – de keynotes uitgezonderd – betere cijfers dan enig van de voorgaande jaren.

Nu we toch terugkijken, mag ook nog wel gememoreerd worden dat in negen jaar een indrukwekkende hoeveelheid interessante presentaties is verzameld, op slideshare of andere platforms, waarvan het overgrote deel nog altijd via onze archiefpagina toegankelijk is.
 

En intussen zijn we op weg naar de 10de editie:


 
 
Dit was het vierde en laatste deel uit een serie. Eerder verschenen:
Deel 1: De eerste twee jaar / 2013–2014
Deel 2: Naar de OBA – de grote groei / 2015-2017
Deel 3: Stabilisatie en succes / 2018-2019

D’r kan nog meer bij


Twee van onze workshops zijn weliswaar al volgeboekt, maar bij een aantal is juist nog een boel ruimte voor nieuwe deelnemers. En die zijn ook zo interessant, dat het zonde is als je die zou missen. D’r kan echt nog meer bij.

In alfabetische volgorde op de namen van de docenten gaat het om:

  • De workshop “Aan de slag met knowledge graphs” door Joyce van Aalten. Deze techniek om informatie makkelijker toegankelijk te maken vindt op steeds meer plekken ingang, voor steeds meer toepassingen. Joyce geeft je er gevoel voor hoe dat werkt door je zelf zo’n graph te laten bouwen.
     
  • De workshop “Werken met Linked Data” door Wouter Beek en Thomas de Groot. Nu steeds meer data gestructureerd beschikbaar zijn, wil je die kunnen combineren en verbinden, zowel binnen als tussen organisaties. De linked data standaard maakt dat mogelijk. Met gebruikmaking van de Triply software maak je daar hands-on kennis mee.
     
  • De workshop “Een startende éénpitter in informatie-land” door Erik Elgersma. Uit zijn eigen ervaring laat Erik je kennis-maken met wat goed gaat en wat niet, als je een informatie-afdeling opstart. Actuele gegevens van zijn eigen bedrijf gebruikt hij daarbij als case study. Daarbij worden vragen gesteld die relevant zijn voor iedere informatie professional.
     
  • De workshop “Bewerken van datasets met OpenRefine” door Sandra Fauconnier (er is vooral nog veel plaats in de ochtendsessie). Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata.
     
  • De workshop “Grote hoeveelheden tekst analyseren als data” door Max Kemman. Je maakt kennis met tools die het mogelijk maken grote hoeveelheden tekstuele informatie te analyseren en daar gestructureerd gegevens aan te ontlenen. Je kan met eigen materiaal werken of met wat Max voor je klaar zet.
     
  • De workshop “Werken met Wikidata” door Hanno Lans. Je leert hoe je voor je eigen informatiesystemen gebruik kunt maken van gegevens over de 100 miljoen entiteiten die intussen al in Wikidata zitten en van de relaties daartussen. En ook hoe je er zelf nog meer in kunt stoppen. OpenRefine komt daarbij ook aan de orde.

Zie je hier iets nuttigs bij? Meld je dan aan.
En kijk anders ook nog een keer bij de paar workshops die we hier nu niet genoemd hebben (en waar ook nog wel een paar mensen bij kunnen).
 
aanmelden

Het pure zoeken


In voorgaande blogposts hadden we nog niet veel aandacht besteed aan het “pure zoeken”, wat toch altijd een wezenlijk onderdeel van ons jaarlijkse programma vormt. Naast de veelheid aan gereedschappen voor het verwerken van gevonden gegevens dat eerder aan de orde kwam, zijn er namelijk ook wel degelijk pure zoekonderdelen.

In de eerste plaats zijn dat twee heel praktische onderdelen. Zo verzorgt Ewoud Sanders zijn bekende workshop “Slimmer zoeken in Delpher“. Met ruim 100 miljoen gedigitaliseerde pagina’s uit Nederlandse kranten, boeken en tijdschriften is Delpher een ware goudmijn, waarin je meer en betere resultaten vindt als je weet welke zoektechnieken je kunt toepassen.
Daarnaast is er een nieuwe workshop van Bianca Kramer en Jeroen Bosman. Zij besteden aandacht aan zoektechnieken om betrouwbare informatie op te sporen, zoals die nodig is voor systematic reviews. Maar dan niet via de gecontroleerde bibliografische databases die daar meestal voor gebruikt worden, maar met webzoekmachines. Zij stellen de vraag of je daarmee ook zodanig precies en gecontroleerd kunt zoeken, dat het resultaat aan de strengere eisen voor systematic reviews voldoet.

Naast deze workshops is er dan natuurlijk nog de spannende keynote waarmee we de dag openen. Andrew Yates, assistent hoogleraar bij IRlab aan de Universiteit van Amsterdam, is specialist op het gebied van de toepassing van neurale netwerken. De meesten van ons zullen die term waarschijnlijk alleen kennen in relatie tot machine learning technieken die worden toegepast in systemen waarmee teksten of plaatjes steeds beter automatisch geclassificeerd kunnen worden. Maar zulke neural deep learning technieken zijn nu ook in gebruik voor het verbeteren van zoekresultaten. Dergelijke neural search zorgt dan vooral voor een verbeterde ranking van zoekresultaten, doordat de betekenis van stukken tekst beter door zoeksystemen begrepen kan worden. Hoe dat precies werkt en wat voor verbetering dat oplevert, daarover zal Andrew Yates ons 11 mei bijpraten.

De 10de VOGIN-IP-lezing – een terugblik op de vorige negen (3)

Deel 3: Stabilisatie en succes 2018-2019

 

Vorig jaar bleken we toch wat al te angstig te zijn geweest over het aantal deelnemers, zodat we in 2018 de teller gewoon tot 250 hebben laten doorlopen.
Eerste keynote spreker was Joseph Busch over automatische “Content tagging”, een thema dat ook nog een keer terug kwam in een lezing van Suzan Verberne.
 
 
De presentatie van Busch leverde ook een mooie lijst van demosites waarop je dit soort diensten kunt uitproberen. Die vormde meteen een handig uitgangspunt voor de workshop die Eric Sieverts het volgende jaar zou geven. Overigens was er dit jaar ook al een workshop vanJoseph Busch zelf.
De tweede keynote werd verzorgd door Ruben Verborgh uit Gent. Zijn hoofdthema was het toen zeer gehypte “Blockchain”, maar zijn lezing ging vooral in de richting van methoden om internetgebruikers zelf hun persoonlijk gegenereerde gegevens te laten beheren, in plaats van die gegevens aan big tech cadeau te doen. En daarvoor zou blockchain inderdaad een te gebruiken techniek kunnen zijn. Tim Berners Lee had met zijn Solid-project dat idee intussen ook opgepakt. En daarvoor had hij ook samenwerking met Ruben Verborgh gezocht. Aan deze aanpak hangt nu ook wel de term “decentralized web”.

Een andere lezing was van David Graus die het over gepersonaliseerde aanbevelingssystemen had, waarbij hij ook inging op de spanning die bestaat tussen personalisatie en privacy. Overigens lag hier natuurlijk ook wel een link met het vorige onderwerp.
Verder waren er ook twee echte politieagenten die zowel in een lezing als in een workshop lieten zien hoe de politie ook gebruik maakt van informatie uit open bronnen. Hoe echte politiemensen echt onderzoek doen in sociale media, real-time, om boeven te vangen en strafbare feiten te vinden.
En ook Arno Reuser was weer eens van de partij voor het geven van een lezing met de wat raadselachtige titel “Gaat u maar rustig slapen, er is niets aan de hand”. Het bleek een fraaie mix van wat informatieprofessionals aan moeten met onder meer cybercrime, ransomware en fake informatie.
Verder kwam in ons programma voor het eerst ook Wikidata aan de orde in een presentatie van Maarten Dammers.

Andere primeurs zaten bij de workshops. Alexander Pleijter gaf voor het eerst zijn workshop “Zo wordt je factchecker”, die daarna een vast programmaonderdeel zou blijven. Dat gold ook voor de workshop van Guus van den Brekel die handvatten gaf om aan de full-tekst (of PDF) van wetenschappelijke publicaties te komen, ook als ze achter betaalmuren zitten (waarbij SciHub natuurlijk de olifant in de kamer is ….).
 
Nieuw waren verder Kennisvisualisatie door Joyce van Aalten, Tekst en Data mining door Hugo Benne, Semantisch web en tripels door Martijn van der Kaaij, Blockchain door Bianca Kramer en Jeroen Bosman en Slim gebruik van een “portable browser” door Arno Reuser.

En dan was Christiaan Triebert natuurlijk nog terug om nu een workshop van 2 uur te geven, met de mooie titel “Digital Forensics”, over de Bellingcat-technieken voor geolocatie en andere OSINT-taken.
Alles bij elkaar waren er 10 verschillende workshops in 16 sessies die door het grote totale aantal bezoekers toch allemaal goed bezocht waren.

Verder liep bij deze editie nog een filmteam rond, dat een zevental filmclips geproduceerd heeft, met interviews met sprekers, docenten en bezoekers.

Fact checking : uitspraken en interviews rond het thema fact checking en fake-nieuws
(4:36 minuten met o.a. Christiaan Triebert en Alexander Pleijter)
[Eén van de zeven filmclips]

Naschrift:
Dit jaar werd het organiserende team aangevuld met Joyce van Aalten en Marjo Bakker.
Enkele afleveringen eerder had teamlid van het eerste uur Boyd Hendriks het team verlaten.

 


 
 

In 2019 was er niets aan de hand. Voorbereiding en aanmelding verliepen voorspoedig. Er waren 243 deelnemers en geen enkele spreker of workshopdocent zegde ontijdig af.

Eerste keynotespreker was Frédéric Ruys met een enthousiaste presentatie over datavisualisaties.
Zijn lezing “Van data exploratie naar animatie: de valkuilen in visualisaties” maakte duidelijk dat dit echt een specialisme is. Hij was destijds degene die de opvallende visualisaties van de VPRO-serie “Nederland van boven” heeft verzorgd.
De tweede keynote werd gegeven door Eliot Higgins, de oprichter van het Bellingcat collectief, die we dit keer zelf naar Amsterdam hadden weten te krijgen. Misschien wel iets makkelijker sinds Bellingcat een vestiging in Nederland in Den Haag heeft gekregen. Iets dat mede mogelijk werd door de bijdrage van een half miljoen die ze eerder dat jaar voor dat doel van de postcodeloterij hadden gekregen – door Christiaan Triebert in ontvangst genomen. De titel van Eliot’s lezing was ontleend aan de eerder dat jaar uitgekomen (en op TV vertoonde) documentaire over Bellingcat. oor wie die film gezien had en bij een eerdere optreden van Christiaan Triebert was geweest, bevatte zijn lezing jammer genoeg niet zo heel veel nieuws meer.
Andere lezingen werden gegeven door Arnout Engelfriet (over wat de AVG privacy wetgeving voor zoeksystemen betekent), door Daan Odijk (over algoritmes die bij mediaorganisaties worden gebruikt), door Paula Kassenaar (over de bij Zalando ontwikkelde Knowledge Graph), door Marieke van Erp (over het aan oude krantenberichten ontlenen van recepten – voor gerechten), door Cynthia Liem (hoe “verborgen schatten” – de veelheid aan intussen gedigitaliseerd materiaal – bij het publiek terecht te laten komen) en door Folgert Karsdorp & Mike Kestemont. De lezing van deze beide laatsten ging over het door de computer laten genereren van hiphop-teksten en over een experiment dat ze daarmee op Lowlands hadden uitgevoerd. Bezoekers van hun stand moesten bepalen of random op het scherm getoonde hip-hop teksten door een mens of door een computer gemaakt waren.

Van de tien workshops die dit jaar werden aangeboden, waren alleen die van Alexander Pleijter (Zo word je factchecker) en die van Guus van den Brekel & Robin Ottjes (Hoe kom ik aan de full-text?) “gouwe ouwe”. De onderwerpen van de andere acht waren helemaal nieuw: Knowledge Graphs (van Joyce van Aalten en Daphne Shinn), Zoekmachine-marketing [SEO] (van Hugo Benne), Wikidata en Sparql (van Maarten Dammers), Onderzoeksdata (van Ellen Fest & Hilde van Zeeland), Taxonomy design (van Heather Hedden – de Amerikaanse auteur van het leerboek “The accidental taxonomist“), Politiek en informatie (van Frank Huysmans), Semantische wetenschappelijke zoekmachines (van Bianca Kramer & Jeroen Bosman) en Automatisch metadateren (van Eric Sieverts).
 
Lieten we twee jaar geleden weten aan de crowdfunding actie van Bellingcat te hebben bijgedragen, dit jaar hebben we een bescheiden bijdrage toegezegd aan een crowdfunding actie voor Nieuwscheckers, het factchecking project van de afdeling Journalistiek en Nieuwe Media van de Universiteit Leiden. Deze actie was bedoeld om stelselmatiger het nieuws rond de Europese verkiezingen te kunnen checken. Ook in dit geval werd het (overigens bescheiden) streefbedrag gehaald.

 


Dit was het derde deel uit een serie van vier. Eerder verschenen:
Deel 1: De eerste twee jaar / 2013–2014
Deel 2: Naar de OBA – de grote groei / 2015-2017
en intussen ook nog:
Deel 4: Covid 19 gooit roet in het eten / 2020-2021

Archief beter vindbaar maken met Records in Contexts


Linked (Open) Data is voor informatieprofessionals belangrijk gereedschap bij het vindbaar maken van informatie. Het onderwerp komt dit jaar daarom in een aantal lezingen en workshops aan bod. Onder andere in de lezing van Merel Geerlings en Ivo Zandhuis.

Merel en Ivo komen vertellen hoe men bij het Stadsarchief Amsterdam linked data inzet om tot betere zoekresultaten voor de gebruiker te komen. De sprekers zien dat linked data veel denkstappen wegneemt bij de gebruiker omdat je via de relaties die in het schema zijn vastgelegd, makkelijker associatief kunt zoeken. Bovendien kun je als informatieprofessional profiteren van elkaars kennis door verbindingen te leggen met elkaars terminologiebronnen. Zo concentreert het Stadsarchief zich bijvoorbeeld op de metadata waar zij expert in is – de straten, personen en organisaties van Amsterdam – en richt zich voor de andere te beschrijven concepten op de terminologiebronnen die collega’s elders al hebben gemaakt.


Visualisatie van een metadatanetwerk in RiC.
Bron: Stadsarchief Amsterdam, ‘Records in Contexts (4): Metadatanetwerk,’ 21 april 2021

 
Het Stadsarchief gebruikt sinds kort de nieuwe archiefbeschrijvingsstandaard Records in Contexts (RiC) om het archiefmateriaal vindbaar te maken. RiC is gebaseerd op linked data en heel geschikt om digitaal materiaal mee te beschrijven. Komt er met RiC een einde aan de voor gebruikers soms ingewikkelde hiërarchisch opgebouwde inventarissen? Merel en Ivo zullen ons in hun lezing daar meer over vertellen. En misschien ook wel over de ‘blauwdruk’ die bij het Stadsarchief is gemaakt van alle interne metadata en vocabulaires èn de verbindingen naar buiten.

Omdat het Stadsarchief één van de eerste archiefinstellingen is die RiC gebruikt, verscheen afgelopen jaar speciaal voor de vakgenoten een tiental blogposts over de implementatie. De blogposts vind je terug op het Bronnen in bytes blog van het Stadsarchief.

De 10de VOGIN-IP-lezing – een terugblik op de vorige negen (2)

Deel 2: Naar de OBA – de grote groei 2015-2017


Gezien de groei van het aantal deelnemers en van vooral het aantal aan te bieden workshops, moest voor 2015 al weer worden uitgekeken naar een nieuwe locatie. Dat werd de OBA op het Oosterdokseiland, met een grote theaterzaal, veel goed geoutilleerde extra ruimtes voor workshops en ook goed bereikbaar zo dichtbij Amsterdam CS. Uiteindelijk kwamen er dat jaar 183 deelnemers – toch nog nauwelijks meer dan de 180 van het jaar ervoor. Niettemin was het wel een mooi gezicht zo’n grote zaal met toch wel heel veel mensen. En nu pasten ze er tenminste allemaal (ruim) in.

Keynote sprekers dat jaar waren de Amerikaan Greg Notess en Piek Vossen, hoogleraar Computationele Lexicologie bij de VU.
Notess was vooral bekend als kritisch volger van de functionaliteit en dekking van allerlei soorten webzoekmachines, waarover hij in de internationale vakbladen publiceerde. In een interview voor IP (en in zijn lezing) sprak hij vooral zijn verontrusting uit dat allerlei interessante zoekmachines verdwenen, terwijl er geen serieuze concurrentie voor Google bijkwam.
 
Taaltechnoloog Piek Vossen had in IP al vragen van ons beantwoord voordat hij in zijn lezing inging op door zijn team ontwikkelde methoden om slimme analyses te doen op de inhoud van grote hoeveelheden vooral zakelijk nieuws zoals bij LexisNexis beschikbaar is. Door uit de tekst daarvan gestructureerde RDF data te genereren, wordt het bijvoorbeeld mogelijk de ontwikkelingen in bepaalde sectoren uit dat nieuws af te leiden.
 

Een andere lezing werd gegeven door Peter Mika van (toen) Yahoo, over de Schema.org standaard, waarvan hij één van de ontwikkelaars was.
Erik Elgersma, verantwoordelijk voor de marktinformatievoorziening van FrieslandCampina, maakte duidelijk dat zo verkregen kennis van de internationale markt tot belangrijk concurrentievoordeel kan leiden.
Daarnaast was er voor het eerst ook een lezing waarin aandacht werd besteed aan methoden van automatische beeldherkenning; en in het bijzonder hoe dat zelfs kan zonder dat een systeem vooraf al van voorbeelden van al benoemde concepten geleerd heeft.

Bij de workshops komen we veel intussen vaste namen tegen: Joyce van Aalten, Bianca Kramer, Jeroen Bosman, Arno Reuser, Boyd Hendriks, Marina Noordegraaf, Frank Huysmans en Eric Sieverts. Nieuw was Ewoud Sanders die voor het eerst slimmer leerde zoeken in Delpher. Verder was Greg Notess, nu hij toch in Nederland was, ook voor een workshop gecharterd.
 

De laatste lezing was nog maar net afgelopen of Arno Reuser en Eric Sieverts moesten komen opdraven in de radiostudio elders in de OBA om live voor zender AmsterdamFM te vertellen over de belangrijke dingen die ze van de sprekers op het congres geleerd hadden. Intussen konden de deelnemers al ontspannen napraten onder het genot van een drankje, een hapje en een muziekje.

 
 
 
Naschrift:
Na deze editie namen we afscheid van Anne Cramwinckel, die de eerste drie jaar onze steun en toeverlaat was bij het organiseren van ons evenement.
De verdere jaren werd Monique de Jong onze vaste assistente.
Met ingang van deze editie werd het oorspronkelijke organiserende team (Peter Evers, Boyd Hendriks en Eric Sieverts) aangevuld met Peter van Gorsel en Arno Reuser.

 


 

In 2016 was het aantal deelnemers nog niet meteen spectaculair toegenomen; het waren er dat jaar 186. Toch zag de zaal er weer lekker vol uit en was het ook druk bij de inschrijving.
 
Eerste keynote spreker was Pieter Cobelens, oud-directeur van de MIVD – en op dit moment toevallig ook weer niet van radio en TV weg te slaan, omdat elke talkshow zijn onomwonden mening over de situatie in Oekraïne wil horen. Vooraf beantwoordde hij voor IP vast drie vragen.
Een andere spreker was Peter Burger, ook al regelmatig in de media, omdat hij expert is op het gebied van hoaxes, nepnieuws en factchecking.
Voor het eerst werd dit jaar ook aandacht besteed aan Social media monitoring (door Mart Evers).
Bij de organisatie was dit keer even grote paniek ontstaan toen kort voor het congres twee sprekers om onduidelijke redenen afzegden, de laatste zelfs maar één dag tevoren. Niettemin lukte het voor beide nog vervangers te vinden. Vooral Hanna Jochmann hielp ons last minute geweldig uit de brand. Zij kwam vertellen over de speciale eisen die gesteld moeten worden aan zoeksystemen voor kinderen.

Voor de workshops was weer een aantal van de gebruikelijke docenten aanwezig. Nieuw was Peter Burger die behalve zijn lezing ook een workshop Fatchecking gaf en de Engelsman Andy Black die eveneens een dubbeloptreden verzorgde, met een workshop over sociale netwerken en hoe je daarin snel de belangrijkste personen kunt identificeren.
Een beetje bijzonder was een workshop in de vorm van een discussie naar aanleiding van een getoonde film. Dat was de documentaire “The Decade of Discovery” die laat zien hoe de vindbaarheid van Amerikaanse overheidsinformatie door een combinatie van techniek en regelgeving dramatisch verbeterd is. Daarin ook veel aandacht voor de “mailtjes van Hillary”.
Dat de workshops een succes waren blijkt wel uit het feit dat ruim voor de datum van het congres de helft van de workshops al was volgeboekt.

Heel tragisch en voor iedereen een enorme schok was het overlijden van Wouter Gerritsma een luttele drie maanden nadat hij bij VOGIN-IP nog succesvol een workshop had verzorgd.
 


 

In 2017 zette de groei eindelijk echt door. Zo zelfs dat de inschrijving voortijdig werd gesloten, uit vrees dat bij de plenaire lezingen deelnemers zouden moeten staan. Het bleef daardoor bij 235 deelnemers.
Keynote sprekers waren Herbert van de Sompel en Henk van Ess. Herbert was toen nog werkzaam bij Los Alamos National Laboratory in New Mexico, maar tijdelijk op “sabbatical” in Nederland. Hij heeft aan de wieg gestaan van een hele reeks van innovaties op ons terrein, zoals onder meer OpenURL link resolving (bijv. in SFX) en de OAI-PMH en ORE-PMH protocollen om metadata uit repositories te ‘harvesten’.
Zijn lezing ging over link-rot en link-roest, het na enige tijd niet meer werken van links naar zelfs wetenschappelijke informatie en vooral over hoe webarchieven zoals Archive.org daar iets aan kunnen doen.
 
Voor veel aanwezigen was dit waarschijnlijk de eerste keer dat ze hoorden van het mede door Herbert ontwikkelde Memento-protocol om van intussen verdwenen of gewijzigde webpagina’s zo ongemerkt en automatisch mogelijk gearchiveerde oude versies te lokaliseren en op te vragen.
En Henk van Ess? Die had een spannende lezing over een onder tijdsdruk uit te voeren webrecherche naar een Jihad-strijder. Zijn workshop ‘s ochtends was een update over Archive.org (wat mooi aansloot bij Herbert van de Sompel) en van de zoekmogelijkheden bij Google en Facebook.
Verder waren er onder meer lezingen van Cees Snoek over zoeken in videomateriaal en van Karen Blakeman over betrouwbare bedrijfsinformatie (ook een workshop daarover trouwens).
Voor het eerst trad Christiaan Triebert – toen van Bellingcat – bij ons op. Die presenteerde een ook al spannende lezing waarin hij de technieken onthulde waarmee hij onder meer de mislukte coup in Turkije had onderzocht. Met dat onderzoek won hij een maand later trouwens de prestigieuze European Press Prize. Een aanleiding voor herhaalde televisieoptredens. Vooral Mathijs van Nieuwkerk nodigde hem graag uit. Overigens waren Christiaan en Henk van Ess elkaar al eerder toevallig tegengekomen bij een evenement op Malta.Missile Launcher En later – nog voor ons congres – waren ze ook al samen in het nieuws naar aanleiding van hun analyses van de beelden van een in Caïro gevonden raketwerper. Daarbij prees Henk Christiaan al aan als “the fastest geolocation tracker in the world“.

Van de workshops werden er hierboven al een paar genoemd. Ondanks dat het er bij elkaar tien waren, waarvan een aantal ook tweemaal werd gegeven, was de helft al ruim voor de congresdag volgeboekt.

De lezing van Christiaan was voor ons nog aanleiding om deel te nemen aan Bellingcat’s toen net lopende crowdfunding actie, te bekostigen uit de (bescheiden) opbrengsten van ons congres. Het was een “alles of niets” actie, waarbij een vastgesteld eindbedrag gehaald moest worden. Door ook het GO-fonds en het VOGIN-fonds hierbij te betrekken, konden wij net het verschil maken en werd het ALLES. De andere 1417 mensen die geld hadden toegezegd moesten daardoor ook allemaal dokken. Van Christiaan kregen we bovendien de toezegging dat hij dan voor VOGIN nog een training van een hele dag zou verzorgen, om de deelnemers wegwijs te maken in de door hem toegepaste technieken om open source materiaal te analyseren, zoals het geolokaliseren van foto’s en video’s.

Dagvoorzitter Peter van Gorsel en Eric Sieverts sluiten de dag af

 
 


Dit was het tweede deel uit een serie van vier. Eerder verscheen:
Deel 1: De eerste twee jaar / 2013–2014
Er volgen ook nog:
Deel 3: Stabilisatie en succes / 2018-2019
Deel 4: Covid 19 gooit roet in het eten / 2020-2021

De 10de VOGIN-IP-lezing – een terugblik op de vorige negen (1)

Deel 1: De eerste twee jaar – 2013 – 2014


De allereerste aflevering – in 2013 – vond plaats in (Vlaams Cultuurhuis) De Brakke Grond aan de Nes in Amsterdam. Dat jaar waren er 165 deelnemers. Bij de vijf plenaire lezingen pasten die makkelijk in de grote Expozaal. Maar voor de zes in de ochtend gehouden workshops – twee van de acht die waren aangekondigd gingen niet door wegens te weinig belangstelling – was dat nogal passen en meten.
Zo gaf Arno Reuser zijn workshop “Veilig zoeken” in een zaaltje boven het café van de Brakke Grond, dat gewoon open was voor publiek. Het door de kieren doorklinkende luide gepraat van beneden was voor Arno, maar vooral ook voor de deelnemers nogal hinderlijk (en voelde niet zo veilig ….).

Eric Sieverts gaf zijn workshop “Semantisch zoeken” aan het eind van een doodlopend gangetje, waar wat stoelen en een beamer waren neergezet.
De Engelse zoekgoeroe Phil Bradley had het voor zijn workshop (“Advanced search techniques and alternative search engines”) beter getroffen, want hij had het stijlvolle antieke theaterzaaltje van de Brakke Grond tot zijn beschikking – bovenaan deze post zag je al een fisheye opname van dat zaaltje in lege toestand.
Henk van Ess (“Wat is waar of niet waar in Sociale Media?”) had met zijn vijftien deelnemers helemaal volop de ruimte in de grote Expozaal waar ‘s middags de plenaire lezingen werden gehouden.
Jeroen Bosman zat met zijn workshop “Zoeken naar Beeld En Geluid” in een leuk nogal verduisterd zaaltje, “de lounge”.

Marina Noordegraaf (“Onderzoeksdata”) zat in de keurige “groene zaal” in een verre uithoek van het ingewikkelde complex.

Bij de lezingen in de middag was nogmaals Phil Bradley present, nu met zijn lezing “The changing landscape of web search“.
Verder was onder meer Henk van Ess als spreker aanwezig met zijn presentatie “LET’S GET PERSONAL met Facebook Graph Search en Google Now”. In latere jaren zou hij nog meerdere keren present zijn.
Antal van den Bosch sprak over “Text mining: automatische en grootschalige analyse van entiteiten en gebeurtenissen in tekst“. Vorig jaar bij de negende editie van de VOGIN-IP-lezing verzorgde hij opnieuw een keynote.


Bijzonder was nog dat na afloop Eric Sieverts de (eerste) Zilveren VOGIN-speld opgeprikt kreeg. Onder (veel) meer vanwege het mede organiseren van deze dag.
 
 


 


Omdat De Brakke Grond in 2014 niet beschikbaar was, moesten we meteen al weer op zoek naar een ander onderkomen. Daarvoor kwamen we uiteindelijk vlak om de hoek terecht, bij De Industrieele Groote Club op de Dam.
Intussen was het aantal deelnemers gestegen naar 180 en zoveel pasten nu juist niet meer in de grootste daar beschikbare zaal, zodat de lezingen in de middag gestreamd moesten worden naar de Bibliotheek elders in het gebouw, waar de minder gelukkige deelnemers een zitplaats vonden.
Da ambiance in De Industrieele Groote Club was verder wel heel stijlvol en fotogeniek, zodat we hieronder wat meer foto’s uit ons archief hebben opgediept.

 
 
 

Voor de workshops was een veelheid aan kleinere en grotere ruimtes beschikbaar. Zo had Eric Sieverts de deelnemers aan zijn workshop “Semantisch zoeken” om een ronde tafel in de Dameszaal verzameld en stond zijn presentatiescherm bovenop een mooi antiek kastje.
 

Arno Reuser zat dit keer niet boven een lawaaiïg café, maar hij kon zijn workshop “Anoniem zoeken” in de fraaie Carel Willink-kamer geven.

Er waren ook grotere ruimtes, met uiteenlopende oorspronkelijke bestemmingen. Bianca Kramer stond bijvoorbeeld in de Bestuurskamer met haar workshop “Library mashups – nieuwe diensten creëren met Web2.0 tools”.

 

Joyce van Aalten gaf haar workshop “Informatie vindbaar maken met metadata en taxonomieën” tegenover een bar met een heleboel uitnodigend glaswerk in de Damzaal, met -uiteraard- uitzicht op de Dam.

 

En voor de volledigheid dan ook nog even Jeroen Bosman over het vinden van Open Access materiaal in de Herenzaal en Boyd Hendriks met zijn Kennismanagement Update in de Foeke Kuiperskamer.

 

En dan nog iets over twee sprekers uit het middag-programma. De Amerikaanse zoekexpert Marydee Ojala – ook redacteur en columniste van het blad “Online Searcher” – en Maarten de Rijke die een meer technisch aspect van zoekmachines belichtte.

Verder werd ook deze editie van de VOGIN-IP-lezing afgesloten met het uitreiken van een “speld”. Dit keer kreeg Peter Evers als tweede gelukkige de Zilveren VOGIN-speld opgeprikt voor zijn talloze verdiensten voor het vak, waarbij laatstelijk ook zijn inspanningen voor het organiseren van de VOGIN-IP-lezing.