Anonimiseren is wat anders dan “zwartlakken”

Documenten waar organisaties mee te maken hebben, bevatten vaak een heleboel (privacy)gevoelige gegevens. Dat is zeker het geval bij overheidsorganisaties, maar ook bij heel veel commerciële bedrijven. Vanwege onder andere de AVG moeten die documenten geanonimiseerd en/of gepseudonimiseerd worden, voordat ze verder verwerkt kunnen (en mogen) worden. Dat moet ervoor zorgen dat lezers van die documenten zulke gegevens niet in hun oorspronkelijke vorm te zien krijgen. Maar de tekst moet natuurlijk wel leesbaar en begrijpelijk blijven. De zwartgelakte stukken die regelmatig in het politieke nieuws opduiken, zijn voorbeelden van een wel heel ruwe methode van anonimiseren; gewoon alles zwart maken. Met eisen van leesbaarheid staat die werkwijze op wel heel gespannen voet.

Gezien de hoeveelheid en de omvang van de documenten waarmee organisaties te maken hebben, is het haast ondoenlijk om dit anonimiseren nog handmatig te doen. En – je voelt het al aankomen – ook daarvoor wordt intussen AI ingezet. Daarbij worden technieken als Natural Language Processing (NLP) en Named Entity Recognition (NER) toegepast. Ìn de workshop van Leonard van der Leeden over “beproefde AI-oplossingen voor gegevens­bescherming bij overheden” maken deelnemers kennis met de DataMask software (nu onder de naam xxllinc Anonimiseren). Hoe dat in zijn werk gaat wordt onder meer geïllustreerd aan het voorbeeld van het pseudonimiseren van uitspraken van de Hoge Raad.

Leuk dat we bij de VOGIN-IP-lezing nu ook eens een workshop vanuit de juridische praktijk kunnen aanbieden. En het goede nieuws is dat er nog plaatsen vrij zijn.

aanmelden

Wie wordt zelf factchecker?


Facebook houdt op met Factchecken. Alexander Pleijter komt daar in bovenstaand bericht op Bluesky nog weer even op terug. Moet je dat factchecken dus voortaan maar zelf gaan doen, nu socials – en Facebook is niet de enige – daarmee stoppen?
Bij de VOGIN-IP-lezing verzorgde Alexander Pleijter jaarlijks een workshop “Zo word je factchecker”. zodat je het na het volgen van die workshop inderdaad zelf zou moeten kunnen doen. Maar hoe gaat dat verder, nu Alexander gestopt is met het geven van zijn workshop? Gelukkig heeft hij zelf een vervanger gevonden, een collega van hem bij “Nieuwscheckers“. Op 27 maart verzorgt Aafko Boonstra dit langzamerhand klassieke onderdeel uit het VOGIN-IP-programma, zodat je dat factchecken nog steeds zelf kunt gaan doen. En het goede nieuws is dat bij die workshop nog een paar plaatsen vrij zijn. Misschien een aardige oefening om eerst zelf nog even te checken of onze mededeling over die vrije plaatsen fact of fake is.

De wetenschap gevisualiseerd


De wetenschap is bij uitstek een terrein van verbanden en relaties. Met relaties tussen auteurs, met verbanden tussen onderwerpen, met citatielinks tussen publicaties, met connecties tussen instituten en met relaties tussen al dit soort entiteiten onderling. Informatie daarover is al heel lang digitaal beschikbaar en in toenemende mate ook vrij toegankelijk.
Die verbanden in kaart brengen is niet iets dat je nog handmatig moet willen doen. Bij CWTS, Centre for Science and Technology Studies, een onderzoeksinstituut van de Universiteit Leiden, is daar een fraai softwarepakket voor ontwikkeld: VOSviewer. Daarvan bestaat een webversie die je online kunt gebruiken, maar je kunt het ook downloaden voor lokaal gebruik.
Gezien de achtergrond van CWTS is VOSviewer primair toegesneden op de analyse van bibliometrische netwerken, maar in feite kan die software ook gebruikt worden om andere soorten netwerken te exploreren en visualiseren. En het goede nieuws is dat VOSviewer gratis is. Zowel om te downloaden als om online te gebruiken. Geen wonder dat er over de hele wereld gebruik van wordt gemaakt. Publicaties die de makers over het pakket schreven, zijn zelf ook al onderdeel van zo’n bibliometrisch netwerk. Dat heeft die publicaties al vele duizenden bibliografische citaties opgeleverd. Daarmee heeft de hoofdontwikkelaar van het pakket, Nees Jan van Eck intussen al een formidabele H‑index van 53 kunnen opbouwen.


Voor wie praktijkervaring wil opdoen met VOSviewer, verzorgt Nees Jan op 27 maart bij de VOGIN-IP-lezing weer een workshop over gebruik en mogelijkheden van het pakket. Sinds de eerste keer dat Nees Jan hierover bij ons een workshop verzorgde, intussen al weer vier jaar geleden, is nog weer nieuwe functionaliteit toegevoegd. Dat betreft onder meer ondersteuning van meer vrij toegankelijke en open databronnen (zoals OpenAlex – waarover 27 maart trouwens ook een workshop is) en een nieuwe functie om interactieve visualisaties eenvoudig online te delen. Dus een heleboel redenen om je nu voor deze workshop aan te melden.
_________________________________________________________________________________

Reactie op deze post door Richard Santos Lalleman (Kopenhagen) – 27 feb 2025

“Een ander leuk voorbeeld hoe VOSViewer is gebruikt, is om de studie van de liefde te begrijpen. Hieronder zie je wie wat geschreven heeft over welk liefdesonderwerp. Het was in ieder geval tot in Nature Magazine gekomen 🤔
Allemaal leuk die visualisaties, maar de echte waarde ligt in de data daarachter die interacties quantificeren.”


Network map of authors engaged in romantic love researches (threshold = 5).
The authors’ cooperative network was partitioned into eight distinct clusters.

Workshop of lezing?


De workshops beginnen al aardig vol te lopen. Van twee van de drie workshops die wegens succes 2x gegeven worden, is de tweede sessie ook al weer volgeboekt. Maar gelukkig zijn er nog genoeg workshops waar wel wat ruimte is. Daarbij “gouwe ouwe” zoals hoe je aan full-text artikelen komt, hoe je factchecker wordt of hoe je slimmer zoekt in Delpher, maar ook een paar nieuwe zoals AI-oplossingen voor gegevensbescherming bij overheden, grote hoeveelheden tekst analyseren als data of aan de slag met generatieve AI in de mediatheek.
Maar maak je geen zorgen als workshops volgeboekt zijn, want de parallel gegeven lezingen zijn zeker zo interessant. Heel wat workshopbezoekers zullen zelfs nog heftig in dubio zijn of ze toch niet liever naar lezingen hadden gewild. Maar in ons nieuwe aanmeldsysteem kun je eerder gemaakte programmakeuzes gelukkig achteraf nog zelf wijzigen. Over keuzestress gesproken.

10 jaar Bellingcat


14 en 15 november nodigt Bellingcat een ieder uit om hun 10-jarig bestaan te vieren middels twee live presentaties op YouTube. Omdat de VOGIN-IP-lezing een belangrijk deel van die tien jaar met Bellingcat gedeeld heeft, blikken we hier nog even terug op die gezamenlijke acht jaar.

Op de 2017-editie van ons evenement verzorgde Christiaan Triebert voor het eerst een lezing over de OSINT- en geolocatie-activiteiten die hij voor Bellingcat uitvoerde. Voor ons organiserend team was dat aanleiding om aan te haken bij de Crowdsourcing-actie die Bellingcat dat jaar gestart was. Door samenwerking met VOGIN-fonds en GO-fonds lukte het om Bellingcat’s streefbedrag te halen, zodat alle toezeggingen ook echt gehonoreerd moesten worden. Voor ons had dat ook nog twee leuke gevolgen:
  -1: Christiaan werd hierdoor bereid gevonden voor VOGIN een workshop van een hele dag te verzorgen.
  -2: Op de Bellingcat-site kwam een week lang een banner voor de VOGIN-IP-lezing te staan.

In 2019 heeft Eliot Higgins, de oprichter van het Bellingcat collectief, de VOGIN-IP-keynote verzorgd. Hem naar Amsterdam te krijgen was misschien wel iets makkelijker geworden, sinds Bellingcat een vestiging in Nederland in Den Haag had gekregen. Dat was mede mogelijk geworden door de bijdrage van een half miljoen (!!) die ze eerder dat jaar van de postcodeloterij hadden gekregen – op de foto hiernaast door Christiaan Triebert in ontvangst genomen. Vergeleken met dat bedrag was onze crowdfunding-bijdrage van twee jaar eerder natuurlijk maar peanuts.

In ons programma voor 2020 stond ook een keynote van Christiaan geprogrammeerd – al was hij intussen overgestapt naar het Visual Investigations Team van de New York Times. Maar tot onze grote spijt maakte de COVID-19 pandemie dat deze lezing niet live gegeven kon worden. Met enige vertraging is hij uiteindelijk later dat voorjaar wel online als ZOOM-sessie gegeven. Enig voordeel daarvan is, dat deze presentatie ook achteraf nu nog steeds bekeken kan worden. [En ook de rest van het programma.]

Sinds 2023 verzorgt intussen Annique Mossou namens Bellingcat geolocatie-workshops die bij de deelnemers ook weer zeer in de smaak vallen.

Laten we tot slot nog even terugkomen op de uitnodiging van Bellingcat waar we dit bericht mee begonnen. Links voor de twee genoemde YouTube presentaties op 14 en 15 november, vind je op https://www.youtube.com/@bellingcatofficial/streams

Beoordeling van lezingen en workshops


De evaluaties van dit jaar hebben we intussen bekeken. Het doet ons genoegen dat de deelnemers dit jaar weer overwegend positieve beoordelingen gaven aan de lezingen en workshops die we aanboden. Als we vergelijken met voorgaande jaren, zien we dat de hoogste scores wel eens hoger zijn geweest, maar dat de laagste scores – op één uitzondering na – altijd lager waren dan dit jaar. Dus geen negatieve uitschieters en de gemiddelde scores op een hoog niveau.
Daarbij willen we ook de toppers nog even in het zonnetje zetten. Bij de lezingen waren dat ex aequo de lezingen van Michiel van der Meer (keynote over de rol van large language models in informatieverwerking), Fulco Blokhuis (over “AI en IE” – Intellectueel Eigendom) en Daniel Canter (over “ASML’s Taxonomy Adventure”), met alle drie een gemiddelde score van 8.2. Bij de workshops was dat – evenals vorig jaar – die van Annique Mossou (over “Geolocation zoals Bellingcat dat doet”), met een gemiddelde score van 8,6. Runners-up waren dit jaar Daan Damen (over “de waarde van AI voor de culturele sector”) en Shannon van Muijden & Ruben Schalk (“Werken met het termennetwerk”), beide workshops met een gemiddelde van 8,3.
Resultaten van andere aspecten uit de evaluatie houdt u nog even van ons tegoed

Workshops in de aanbieding

De inschrijvingen voor de VOGIN-IP-lezing – en met name voor de workshops – lopen al heel behoorlijk. Drie van de dertien workshops zijn al volgeboekt en van vijf andere schiet dat al aardig op. Er valt dus niets te klagen zou je zeggen. Toch willen we nog even reclame maken voor een drietal workshops waarvoor de belangstelling, in onze ogen ten onrechte, wat tegenvalt:

  1. De workshop “Aan de slag met taxonomieën” door Joyce van Aalten. Joyce is bijna elk jaar paraat met een workshop over een techniek voor het vindbaar maken van informatie. Die workshops plachten altijd goed bezocht en achteraf goed beoordeeld te worden. Het verbaast ons dus dat de belangstelling dit keer vooralsnog wat achter blijft. Zeker gezien het feit dat taxonomieën nog altijd een belangrijk hulpmiddel zijn voor het toegankelijk maken van informatie.
  2. De workshop “Werken met het termennetwerk” van Shannon van Muijden en Ruben Schalk. Dat termennetwerk is een toepassing van linked data op het terrein van digitaal erfgoed. Bij deze workshop leer je hoe je termen geautomatiseerd kunt toekennen met behulp van de OpenRefine software en met good-old Excel. Deze workshop was vorig jaar voor het eerst onderdeel van ons programma. Toen waren er aanzienlijk meer aanmeldingen dan nu. Dus waar blijven jullie?
  3. De workshop “Geolocation zoals Bellingcat dat doet” door Annique Mossou. Ook deze workshop werd vorig jaar al een keer gegeven. Toen was het verreweg de best beoordeelde workshop uit ons hele programma. Dat maakt het extra jammer dat aanmeldingen voor deze workshop nu wat lijken achter te blijven. Annique’s Bellingcat-achtergrond vormt hierbij nog een extra aanbeveling om deze workshop niet te willen missen.

We kijken ernaar uit je 18 april in de OBA te ontmoeten bij één van deze workshops of natuurlijk bij één van de andere onderdelen van ons programma. Aanmelden kan hier:
 
aanmelden

Bijna vol (2)


Het gaat nu eens niet om de vraag of een glas half vol of half leeg is, maar om workshops die al bijna helemaal vol zitten. Voor vier van de in ons vorige bericht gemelde workshops is dat nu echt het geval. Daarom ook nog even aandacht voor de vijf workshops waar nog wat meer ruimte is (al zijn die ook al meer dan half vol ….).

Dat zijn:

  • De workshop “Bewerken van datasets met OpenRefine” door Erwin Verbruggen. Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata. [Nog 4 plaatsen]
  • De workshop “Slimmer zoeken met Delpher” door Ewoud Sanders. Met ruim 100 miljoen gedigitali­seerde pagina’s uit Nederlandse kranten, boeken en tijdschriften is Delpher.nl een ware goudmijn. In deze workshop leert Ewoud Sanders je hoe je het meeste uit Delpher kunt halen. [Nog 4 plaatsen]
  • De workshop “Open (source) infrastructuur voor de wetenschap” door Jeroen Bosman en Bianca Kramer. Bij veel organisaties groeit de aandacht voor open infrastructuur voor onderwijs en onderzoek. In deze workshop kijken we naar al bestaande infrastructuur en hoe daarop over te stappen. [Nog 5 plaatsen]
  • De workshop “Zo word je factchecker” door Alexander Pleijter. Hierin gaat het over de diverse kanten van het factchecken: hoe controleer je of nieuws klopt? Welke tools gebruik je daarbij? Aan de hand van opdrachten krijg je een kijkje in de keuken van de factchecker.
    [De ochtendsessie is al vol; in de middag nog 6 plaatsen]
  • De workshop “Geolocation zoals Bellingcat dat doet” door Annique Mossou. Welke tools of websites kun je het beste gebruiken om er achter te komen waar een foto of video precies gemaakt is? Annique zet je aan het werk met die tools en toe te passen methoden. [De middagsessie is al vol; in de ochtend nog 7 plaatsen]

Geïnteresseerd om één van deze onderwerpen in je werk te gaan toepassen? Meld je dan aan voordat deze workshops ook volgeboekt zijn.
 
aanmelden

Bijna vol


Nu een aantal van de VOGIN-IP workshops al is volgeboekt, leek het ons goed even te laten weten voor welke je intussen haast moet maken, omdat ze “bijna vol” zijn.

Op volgorde van het aantal nog beschikbare plaatsen [laatst bijgewerkt 20/2] gaat het om:

  • De workshop “Hoe kom ik nu aan de full-text” door Guus van den Brekel & Robin Ottjes. Je leert daarin over de vele verschillende manieren die er zijn om aan de volledige (digitale) tekst van weten­schappelijke publicaties te komen, ook als ze achter betaalmuren opgesloten zijn. [Nog 1 plaats]
  • De workshop “Grote hoeveelheden tekst analyseren als data” door Max Kemman. Je maakt kennis met tools die het mogelijk maken grote hoeveelheden tekstuele informatie te analyseren en daar gestructureerd gegevens aan te ontlenen. Je kan met eigen materiaal werken of met wat Max voor je klaar zet. [Nog 2 plaatsen]
  • De workshop “Werken met het termennetwerk” door Bob Coret & Shannon van Muijden. Leer hoe je rommelige thesauri kunt opschonen met behulp van het termennetwerk en ze computer-leesbaar kunt maken, geautomatiseerd met OpenRefine en good-old Excel. [Nog 2 plaatsen]
  • De workshop “Bibliometrische visualisaties voor het bijhouden van wetenschappelijke literatuur” door Nees Jan van Eck. Introductie in het gebruik van VOSviewer. Deelnemers worden begeleid in het maken van visualisaties van een onderzoeksveld naar keuze, op basis van een zelfgekozen databron. [Nog 2 plaatsen]
  • De workshop “Bewerken van datasets met OpenRefine” door Erwin Verbruggen. Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata. [Nog 4 plaatsen]

Nuttig? Meld je daar dan voor aan.
En kijk anders bij de vier workshops waarvoor nog meer dan vier plaatsen vrij zijn.
Dat zijn de workshops van Ewoud Sanders, van Jeroen Bosman & Bianca Kramer, van Alexander Pleijter (de middagsessie) en van Annique Mossou (de ochtendsessie).
 
aanmelden

De Bellingcat-methode

Middels bij ons bekend geworden namen als Eliot Higgins en Christiaan Triebert is Bellingcat in het verleden al een aantal keren paraat geweest bij de VOGIN-IP-lezing. Bellingcat is intussen alom bekend om zijn methode van open bronnenonderzoek. En dat beperkt zich lang niet alleen tot het befaamde onderzoek naar het neerschieten van MH17, maar ook naar intussen honderden andere zaken. Van de coup in Turkije tot de Skripal vergiftiging, van bombardementen in Syrië tot executies in Lybië en Kameroen, van de moord op Shireen Abu Akleh tot recent gepleegde oorlogsmisdaden in Oekraïne. Daarom wilden we in onze workshops graag weer eens praktisch aandacht besteden aan de “Bellingcat methode”. Te meer daar Bellingcat intussen in Nederland gevestigd is en hier als stichting staat ingeschreven.

Toepassen van “OSINT” kan natuurlijk allerlei doelen dienen, waarbij heel uiteenlopende technieken en tools worden toegepast. Een aansprekende techniek die bij Bellingcat – maar ook elders – vaak met succes wordt gebruikt, is geolocation. Het bepalen op welke exacte lokatie een foto of video gemaakt is, en liefst ook nog wanneer. We zijn dan ook blij dat een docent van Bellingcat – de Nederlandse Annique Mossou – een workshop komt geven over dit specifieke onderdeel van de “Bellingcat methode”.


Een workshop van 2 uur biedt helaas onvoldoende tijd om deelnemers ook kennis te laten maken met al die andere technieken en te gebruiken hulpmiddelen, analysetools en bronnen uit het Bellingcat-arsenaal. Wie daar een indruk van wil krijgen moet maar eens op de site van Bellingcat kijken. En Annique zal ook zeker verwijzen naar dit soort nuttige bronnen voor wie verder wil gaan dan “alleen maar” geolocatie.


Geolocatie is een techniek die natuurlijk ook bij Factchecking een belangrijke rol kan spelen. Maar om te bepalen of iets “waar” is, wordt vaak nog heel wat meer ingezet. We zijn dan ook blij dat we dit jaar ook weer een workshop “Zo word je factchecker” kunnen aanbieden. Hoewel dat nu al voor het zesde jaar op rij is, blijft daar onverminderd belangstelling voor. Ook dit jaar weer verzorgd door Alexander Pleijter, initiatiefnemer van “Nieuwscheckers.


Voor beide hier genoemde workshops geldt de aanbeveling je tijdig aan te melden.