Author: voginip
Elisabeth Bik strijdt tegen wetenschapsfraude
Interview met keynote spreker Elisabeth Bik in vakblad IP (2023-2).
| Naar schatting honderdduizend papers heeft ze inmiddels gescreend. Daarmee hoopt ze misstanden in de wetenschap tegen te gaan. ‘Soms zien plaatjes er zo fout uit dat ik me niet kan voorstellen dat niemand anders het ziet.’ |
Wil je Elisabeth Bik 16 maart ook live horen? Aanmelden kan nog steeds.

Patronen
[Bewerking van onze nieuwsbrief d.d. 2 maart]

Hoe een klein congres een grote vraag durft te stellen.
In ons vak hebben we allemaal wel gehoord van patroonherkenning. D.w.z. het kunnen onderscheiden van een patroon in ruwe, ongezuiverde gegevens. ‘De mens is een patroonzoekend dier’ zegt Rens Bod, hoogleraar computationele geesteswetenschappen en geschiedenis, in zijn boek “Een wereld vol patronen – de geschiedenis van kennis“.
Mensen zijn hierin meestal beter dan computers, vooral als de gegevens visueel voorgesteld worden. Met de komst van ChatGPT en DALL·E lijkt zelfs dat voordeel te verdwijnen. Maar het programma van de VOGIN-IP-lezing is in elk geval nog geheel met menselijke hand tot stand gekomen.
Patroonherkenning
De afgelopen jaren zijn wij als VOGIN-IP-team ook heel goed geworden in patroonherkenning. Maar dan op kleine schaal. De aanmeldingen volgen een patroon dat we menen te herkennen. Dat betekent niet dat we er blind op vertrouwen. Het blijft spannend. Dan is er ook nog het patroon van de communicatie met onze doelgroep. Veel tekst maar niet zonder patronen.
Na de eerste nieuwsbrief stromen de inschrijvingen binnen, hoewel dit jaar iets langzamer dan anders. Postcorona verschijnsel misschien. Dan is het even rustig en na de tweede nieuwsbrief trekt het weer aan. Hier past misschien meer bescheidenheid. Het kan toch niet alleen maar liggen aan onze nieuwsbrieven, tweets etc.? De steun van andere kanalen zoals IP zal ook zeker helpen. Bij iedere uiting kunnen we meer exacte informatie kwijt en blijven inschrijvers zich melden.
We zien wel dat bij sommige adressen onze MailChimp-berichten niet langs de spamfilters komen. Sommige collega’s weten dus misschien niet wat ze missen. Wij hebben nog geen oplossing anders dan dat u tijdens het congres misschien iemand mist, een foto maakt en die opstuurt met de vraag: “waar was je?”. Hoe dan ook, het blijft altijd spannend, ondanks of dankzij het patroon.
Dit is bijna de eindstand:

Maar u kunt nog helpen om deze patronen te verstoren.
De lezers van onze nieuwsbrief gaven we daar ook al onderstaande opdracht toe:
Bijna vol
Maar ook zonder zulke last-minute aanmeldingen is het op 16 maart in de OBA al aardig vol met bezoekers. Van de workshops zijn sommige al uitverkocht en sommige andere bijna. In onze blogposts is te zien waar nog een paar plaatsen vrij zijn (of net nog waren ….). Wel is er in elk geval nog wat meer plek bij de lezingen, in de theaterzaal, om bijvoorbeeld zelf te horen hoe Reijer Passchier, hoogleraar digitalisering en de democratische rechtsstaat, de overlevingskansen van onze rechtsstaat onder Big Tech inschat. Dat is dus de “grote vraag” uit de kop waarmee we dit bericht openden.
Reijer Passchier over de macht van Big Tech

[In het nieuwste digitale nummer van IP staat een interview met spreker Reijer Passchier. Hieronder is de tekst ook te lezen.]





Bijna vol (2)

Het gaat nu eens niet om de vraag of een glas half vol of half leeg is, maar om workshops die al bijna helemaal vol zitten. Voor vier van de in ons vorige bericht gemelde workshops is dat nu echt het geval. Daarom ook nog even aandacht voor de vijf workshops waar nog wat meer ruimte is (al zijn die ook al meer dan half vol ….).
Dat zijn:
De workshop “Bewerken van datasets met OpenRefine” door Erwin Verbruggen. Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata. [Nog 4 plaatsen]
De workshop “Slimmer zoeken met Delpher” door Ewoud Sanders. Met ruim 100 miljoen gedigitaliseerde pagina’s uit Nederlandse kranten, boeken en tijdschriften is Delpher.nl een ware goudmijn. In deze workshop leert Ewoud Sanders je hoe je het meeste uit Delpher kunt halen. [Nog 4 plaatsen]
De workshop “Open (source) infrastructuur voor de wetenschap” door Jeroen Bosman en Bianca Kramer. Bij veel organisaties groeit de aandacht voor open infrastructuur voor onderwijs en onderzoek. In deze workshop kijken we naar al bestaande infrastructuur en hoe daarop over te stappen. [Nog 5 plaatsen]
De workshop “Zo word je factchecker” door Alexander Pleijter. Hierin gaat het over de diverse kanten van het factchecken: hoe controleer je of nieuws klopt? Welke tools gebruik je daarbij? Aan de hand van opdrachten krijg je een kijkje in de keuken van de factchecker.
[De ochtendsessie is al vol; in de middag nog 6 plaatsen]
De workshop “Geolocation zoals Bellingcat dat doet” door Annique Mossou. Welke tools of websites kun je het beste gebruiken om er achter te komen waar een foto of video precies gemaakt is? Annique zet je aan het werk met die tools en toe te passen methoden. [De middagsessie is al vol; in de ochtend nog 7 plaatsen]
Geïnteresseerd om één van deze onderwerpen in je werk te gaan toepassen? Meld je dan aan voordat deze workshops ook volgeboekt zijn.

Bijna vol
–
Nu een aantal van de VOGIN-IP workshops al is volgeboekt, leek het ons goed even te laten weten voor welke je intussen haast moet maken, omdat ze “bijna vol” zijn.
Op volgorde van het aantal nog beschikbare plaatsen [laatst bijgewerkt 20/2] gaat het om:
De workshop “Hoe kom ik nu aan de full-text” door Guus van den Brekel & Robin Ottjes. Je leert daarin over de vele verschillende manieren die er zijn om aan de volledige (digitale) tekst van wetenschappelijke publicaties te komen, ook als ze achter betaalmuren opgesloten zijn. [Nog 1 plaats]
De workshop “Grote hoeveelheden tekst analyseren als data” door Max Kemman. Je maakt kennis met tools die het mogelijk maken grote hoeveelheden tekstuele informatie te analyseren en daar gestructureerd gegevens aan te ontlenen. Je kan met eigen materiaal werken of met wat Max voor je klaar zet. [Nog 2 plaatsen]
De workshop “Werken met het termennetwerk” door Bob Coret & Shannon van Muijden. Leer hoe je rommelige thesauri kunt opschonen met behulp van het termennetwerk en ze computer-leesbaar kunt maken, geautomatiseerd met OpenRefine en good-old Excel. [Nog 2 plaatsen]
De workshop “Bibliometrische visualisaties voor het bijhouden van wetenschappelijke literatuur” door Nees Jan van Eck. Introductie in het gebruik van VOSviewer. Deelnemers worden begeleid in het maken van visualisaties van een onderzoeksveld naar keuze, op basis van een zelfgekozen databron. [Nog 2 plaatsen]
De workshop “Bewerken van datasets met OpenRefine” door Erwin Verbruggen. Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata. [Nog 4 plaatsen]
Nuttig? Meld je daar dan voor aan.
En kijk anders bij de vier workshops waarvoor nog meer dan vier plaatsen vrij zijn.
Dat zijn de workshops van Ewoud Sanders, van Jeroen Bosman & Bianca Kramer, van Alexander Pleijter (de middagsessie) en van Annique Mossou (de ochtendsessie).

Explainable AI volgens Nava
[In het nieuwste digitale nummer van IP staat een interview met keynote spreker Nava Tintarev. Hieronder is de tekst ook al te lezen.]
De IKEA Knowledge Graph
Dit jaar is er in het lezingenprogramma weer eens wat meer aandacht voor het vindbaar maken van informatie door middel van “kennisorganisatiesystemen”. Dat is de wat sjiekere benaming voor wat we vroeger onderwerpsontsluiting plachten te noemen. Er is zowel een lezing over taxonomieën als eentje over “knowledge graphs”. Over die eerste lezing hadden we het eerder al; hier meer over die tweede.
Katariina Kari personificeert een interessante combinatie van competenties: uitvoerend musicus en ITer, en daarbij specifiek het semantisch web. Ze combineerde dat eerder al in het realiseren van de digitale transformatie voor klassieke muziek. Na verantwoordelijk te zijn geweest voor de “Fashion Knowledge Graph” van de grote internationale online modeketen Zalando, werkt ze nu aan de knowledge graph van IKEA.
Als informatieprofessionals kennen we intussen natuurlijk wel de principes van wat een knowledge graph is. Maar het is goed om eens te horen welke achterliggende architectuur daar in de praktijk voor ontwikkeld kan worden, zeker als dat bij zo’n groot alom bekend bedrijf als IKEA is. Katariina gaat er in haar lezing op in hoe zij daarvoor een drie-lagen-model toepast.
Dat is ontleend aan de GIST upper ontology for the enterprise. In een artikel in Medium heeft ze dat vorig jaar al eens beschreven. In de eerste plaats zijn er de “soorten dingen” waar het bij het bedrijf om draait. Dat zal vaak maar een beperkt aantal zijn – bij IKEA beschreven met circa 100 centraal beheerde concepten. Die vormen als het ware de “ontologie” met de definitie van klassen en eigenschappen. Daaronder volgen de individuele “dingen”. Eerst in een laag van de onderwerpscategorieën waartoe die dingen behoren. Denk bijvoorbeeld aan iets als boekenkasten. Bij IKEA ligt hun aantal in de duizenden. En daaronder de individuele dingen/produkten zelf, waarvan het aantal bij IKEA – het zal niet verwonderen – wel in het miljoen loopt. Denk daarbij aan iets als “BILLY boekenkast wit 80x28x202 cm”.

Illustration taken from:
https://medium.com/flat-pack-tech/ikeas-knowledge-graph-and-why-it-has-three-layers-a38fca436349
Alleen de concepten voor de eerste twee lagen worden echt door mensen bedacht en bestaan uit gecontroleerd vocabulaire. Voor de grote massa die daaronder volgt, worden de termen automatisch gegenereerd uit de databronnen waarin de gegevens voor die produkten toch al aanwezig zijn. Hoe je dat praktisch kunt organiseren met verantwoordelijkheden, auteurschap en opslag, zal in de lezing ook aan de orde komen.
Deze knowledge graph is (ook) op de klanten van IKEA gericht, om hen een betere digitale “beleving” te kunnen bieden. Voor de interne logistiek van individuele items wordt hij niet gebruikt.
In de rij voor een kaartje?

Gelukkig hoeft u nog niet in de rij te staan om een kaartje voor de VOGIN-IP-lezing te scoren. Sowieso is het natuurlijk een beetje dom van die mensen hierboven om in de kou in een rij te gaan staan als je gewoon digitaal een plekje kunt reserveren.
Voor sommige workshops begint het er intussen wel al om te spannen of u daar nog voor kunt inschrijven, omdat ze bijna vol zitten. Kijk vooraf dus in het programma voor de actuele situatie met betrekking tot de workshops, om te zien welke intussen “uitverkocht” zijn. Maar voor de lezingen-tracks in de grote zaal zijn gelukkig wel altijd nog genoeg plaatsen beschikbaar. En daar tref je ook superinteressante sprekers. Dus zijn er eigenlijk nooit argumenten om je niet aan te melden.
De Bellingcat-methode
Middels bij ons bekend geworden namen als Eliot Higgins en Christiaan Triebert is Bellingcat in het verleden al een aantal keren paraat geweest bij de VOGIN-IP-lezing. Bellingcat is intussen alom bekend om zijn methode van open bronnenonderzoek. En dat beperkt zich lang niet alleen tot het befaamde onderzoek naar het neerschieten van MH17, maar ook naar intussen honderden andere zaken. Van de coup in Turkije tot de Skripal vergiftiging, van bombardementen in Syrië tot executies in Lybië en Kameroen, van de moord op Shireen Abu Akleh tot recent gepleegde oorlogsmisdaden in Oekraïne. Daarom wilden we in onze workshops graag weer eens praktisch aandacht besteden aan de “Bellingcat methode”. Te meer daar Bellingcat intussen in Nederland gevestigd is en hier als stichting staat ingeschreven.
Toepassen van “OSINT” kan natuurlijk allerlei doelen dienen, waarbij heel uiteenlopende technieken en tools worden toegepast. Een aansprekende techniek die bij Bellingcat – maar ook elders – vaak met succes wordt gebruikt, is geolocation. Het bepalen op welke exacte lokatie een foto of video gemaakt is, en liefst ook nog wanneer. We zijn dan ook blij dat een docent van Bellingcat – de Nederlandse Annique Mossou – een workshop komt geven over dit specifieke onderdeel van de “Bellingcat methode”.

Een workshop van 2 uur biedt helaas onvoldoende tijd om deelnemers ook kennis te laten maken met al die andere technieken en te gebruiken hulpmiddelen, analysetools en bronnen uit het Bellingcat-arsenaal. Wie daar een indruk van wil krijgen moet maar eens op de site van Bellingcat kijken. En Annique zal ook zeker verwijzen naar dit soort nuttige bronnen voor wie verder wil gaan dan “alleen maar” geolocatie.
Geolocatie is een techniek die natuurlijk ook bij Factchecking een belangrijke rol kan spelen. Maar om te bepalen of iets “waar” is, wordt vaak nog heel wat meer ingezet. We zijn dan ook blij dat we dit jaar ook weer een workshop “Zo word je factchecker” kunnen aanbieden. Hoewel dat nu al voor het zesde jaar op rij is, blijft daar onverminderd belangstelling voor. Ook dit jaar weer verzorgd door Alexander Pleijter, initiatiefnemer van “Nieuwscheckers.
Voor beide hier genoemde workshops geldt de aanbeveling je tijdig aan te melden.
























