Al 2x bij NPO-OP1, a.s. woensdag live bij VOGIN-IP


Altijd leuk als een voor VOGIN-IP geboekte spreker ineens ook op TV verschijnt. Eerder gebeurde dat met Christiaan Triebert, nu is de beurt aan Knack-factchecker Brecht Castel. Al twee keer mocht hij vorige maand bij NPO-OP1 aanschuiven om te vertellen over zijn factchecking-activiteiten, vooral met betrekking tot (nep)nieuws over Oekraïne ([8 april], [26 april]). Op TV is natuurlijk leuk, maar Brecht a.s. woensdag live horen vertellen is nog veel leuker. Want dan krijgt hij veel ruimer de tijd (40 minuten) om iets van zijn methoden te laten zien en bovendien kan hij daar niet worden onderbroken door eigenwijze presentatoren en andere gasten.

Naar zo’n live lezing zitten luisteren is natuurlijk fantastisch, maar zelf doen is zeker zo leuk. Daarom zijn we blij dat je ook actief met factchecken aan de gang kunt in de workshop van Leon Pauw. Hij is factchecker voor het Leidse Nieuwscheckers en vervangt in deze workshop onze reguliere docent Alexander Pleijter die onverwacht verhinderd was.

Woensdag is natuurlijk kort dag, maar aanmelden kan nog tot uiterlijk dinsdagavond (wel hoe eerder, hoe fijner voor de organisatoren). En je kunt het ook nog combineren: in het ochtendprogramma naar Brecht, in de middag naar Leon’s workshop.
Zien we je woensdag?

 
aanmelden
 

D’r kan nog meer bij


Twee van onze workshops zijn weliswaar al volgeboekt, maar bij een aantal is juist nog een boel ruimte voor nieuwe deelnemers. En die zijn ook zo interessant, dat het zonde is als je die zou missen. D’r kan echt nog meer bij.

In alfabetische volgorde op de namen van de docenten gaat het om:

  • De workshop “Aan de slag met knowledge graphs” door Joyce van Aalten. Deze techniek om informatie makkelijker toegankelijk te maken vindt op steeds meer plekken ingang, voor steeds meer toepassingen. Joyce geeft je er gevoel voor hoe dat werkt door je zelf zo’n graph te laten bouwen.
     
  • De workshop “Werken met Linked Data” door Wouter Beek en Thomas de Groot. Nu steeds meer data gestructureerd beschikbaar zijn, wil je die kunnen combineren en verbinden, zowel binnen als tussen organisaties. De linked data standaard maakt dat mogelijk. Met gebruikmaking van de Triply software maak je daar hands-on kennis mee.
     
  • De workshop “Een startende éénpitter in informatie-land” door Erik Elgersma. Uit zijn eigen ervaring laat Erik je kennis-maken met wat goed gaat en wat niet, als je een informatie-afdeling opstart. Actuele gegevens van zijn eigen bedrijf gebruikt hij daarbij als case study. Daarbij worden vragen gesteld die relevant zijn voor iedere informatie professional.
     
  • De workshop “Bewerken van datasets met OpenRefine” door Sandra Fauconnier (er is vooral nog veel plaats in de ochtendsessie). Je leert met deze open source software om datasets op te schonen, te manipuleren, te transformeren en te koppelen aan externe kennisbanken zoals bijvoorbeeld Wikidata.
     
  • De workshop “Grote hoeveelheden tekst analyseren als data” door Max Kemman. Je maakt kennis met tools die het mogelijk maken grote hoeveelheden tekstuele informatie te analyseren en daar gestructureerd gegevens aan te ontlenen. Je kan met eigen materiaal werken of met wat Max voor je klaar zet.
     
  • De workshop “Werken met Wikidata” door Hanno Lans. Je leert hoe je voor je eigen informatiesystemen gebruik kunt maken van gegevens over de 100 miljoen entiteiten die intussen al in Wikidata zitten en van de relaties daartussen. En ook hoe je er zelf nog meer in kunt stoppen. OpenRefine komt daarbij ook aan de orde.

Zie je hier iets nuttigs bij? Meld je dan aan.
En kijk anders ook nog een keer bij de paar workshops die we hier nu niet genoemd hebben (en waar ook nog wel een paar mensen bij kunnen).
 
aanmelden

Het pure zoeken


In voorgaande blogposts hadden we nog niet veel aandacht besteed aan het “pure zoeken”, wat toch altijd een wezenlijk onderdeel van ons jaarlijkse programma vormt. Naast de veelheid aan gereedschappen voor het verwerken van gevonden gegevens dat eerder aan de orde kwam, zijn er namelijk ook wel degelijk pure zoekonderdelen.

In de eerste plaats zijn dat twee heel praktische onderdelen. Zo verzorgt Ewoud Sanders zijn bekende workshop “Slimmer zoeken in Delpher“. Met ruim 100 miljoen gedigitaliseerde pagina’s uit Nederlandse kranten, boeken en tijdschriften is Delpher een ware goudmijn, waarin je meer en betere resultaten vindt als je weet welke zoektechnieken je kunt toepassen.
Daarnaast is er een nieuwe workshop van Bianca Kramer en Jeroen Bosman. Zij besteden aandacht aan zoektechnieken om betrouwbare informatie op te sporen, zoals die nodig is voor systematic reviews. Maar dan niet via de gecontroleerde bibliografische databases die daar meestal voor gebruikt worden, maar met webzoekmachines. Zij stellen de vraag of je daarmee ook zodanig precies en gecontroleerd kunt zoeken, dat het resultaat aan de strengere eisen voor systematic reviews voldoet.

Naast deze workshops is er dan natuurlijk nog de spannende keynote waarmee we de dag openen. Andrew Yates, assistent hoogleraar bij IRlab aan de Universiteit van Amsterdam, is specialist op het gebied van de toepassing van neurale netwerken. De meesten van ons zullen die term waarschijnlijk alleen kennen in relatie tot machine learning technieken die worden toegepast in systemen waarmee teksten of plaatjes steeds beter automatisch geclassificeerd kunnen worden. Maar zulke neural deep learning technieken zijn nu ook in gebruik voor het verbeteren van zoekresultaten. Dergelijke neural search zorgt dan vooral voor een verbeterde ranking van zoekresultaten, doordat de betekenis van stukken tekst beter door zoeksystemen begrepen kan worden. Hoe dat precies werkt en wat voor verbetering dat oplevert, daarover zal Andrew Yates ons 11 mei bijpraten.

Gereedschappen voor de informatieprofessional

Als je enige gereedschap een hamer is, dan zie je elk probleem als een spijker. Dit gezegde indachtig, is het ook voor een informatieprofessional nuttig over meer gereedschappen te beschikken dan alleen hun “hamer”. Daarom is het heel plezierig dat dit jaar veel van de workshops bij de VOGIN-IP-lezing te maken hebben met gereedschappen voor informatieprofessionals. Je leert daarin om te gaan met tools en technieken voor het bewerken van beschikbare digitale gegevens om ze zelf beter te kunnen verwerken of om anderen er makkelijker iets mee te laten doen. Wat zijn die workshops en welke gereedschappen bieden ze?

De workshop van Kristina Hettne biedt een echte gereedschapskist voor digitale vaardigheden. Daartoe put zij uit het ruime aanbod van de Library Carpentry Community die zich richt op “efficient, effective and reproducible data and software practice“. In haar workshop gaan de deelnemers samen ontdekken hoe verschillende gereedschappen zoals spreadsheetprogramma’s, OpenRefine, R en RMarkdown hen in hun werk kunnen ondersteunen. En ook in welke omstandigheden ze het beste welke tool kunnen gebruiken. Om optimaal van zulke digitale gereedschappen gebruik te kunnen maken, zijn basale digitale vaardigheden nodig. Daartoe wordt gekeken naar de lessen van de “Carpentries” als een voorbeeld van een leeromgeving waarmee je ook zelf aan de slag kunt.

In de workshop van Sandra Fauconnier komt één specifiek stuk gereedschap aan de orde. Met de gratis open source software OpenRefine kun je datasets bewerken en zelfs heel grote datasets, tot honderdduizenden records, kun je daarmee manipuleren, transformeren naar andere formaten en koppelen (‘reconcilen’) met externe databronnen en kennisbanken, zoals Wikidata. OpenRefine wordt gebruikt in veel projecten rond Linked Open Data en is een populair gereedschap in de Wikimedia-gemeenschap.
Je hebt er geen programmeerervaring voor nodig. In Sandra’s workshop leer je alle basishandelingen van de software: data analyseren, filteren, transformeren, clusteren, en ‘reconcilen’ met Wikidata, zodat je na de workshop zelfstandig met OpenRefine aan de slag kunt.

In de workshop van Max Kemman leer je grote hoeveelheden tekst te analyseren, alsof het data is. Je maakt daarin kennis met een aantal tools, die helpen om overzichten te creëren van (grote) datasets van teksten. Daarmee kun je overzichten maken van boeken, wetenschappelijke artikelen, kranten, tweets of e-mails en kun je bijvoorbeeld ontdekken hoe verschillende thema’s zich door de tijd ontwikkelen en of er teksten zijn die afwijken van de rest. Tijdens de workshop gebruik je hiervoor Voyant Tools, een online omgeving waarin allerlei soorten overzichten gemaakt kunnen worden, zoals woordenwolken, topic models, woordentrends en afwijkende woorden per onderdeel. Voor de workshop zal een collectie teksten klaar staan om mee te werken, maar het is natuurlijk nog leuker als je zelf een dataset van eigen teksten mee kunt nemen.

De workshop van Wouter Beek en Thomas de Groot laat je kennis maken met linked data, zowel om eigen data geschikt te maken om ze als linked data beschikbaar te stellen, als om die van anderen te hergebruiken. Nu organisaties steeds meer data met elkaar uitwisselen, wordt het lastiger om data efficiënt te combineren. Daarbij ontstaan vaak steeds meer kopieën van dezelfde gegevens. Met Linked data kun je verschillende databronnen met elkaar verbinden.
In deze workshop werk je met TriplyDB, een SaaS-georiënteerd database product. Aan de hand van concrete voorbeelden krijg je te zien wat de voordelen van linked data zijn. Deelnemers kunnen zelf data als linked data in TriplyDB uploaden en gebruiken. Dat biedt aanknopingspunten voor hoe je linked data binnen je eigen organisatie kunt inzetten om je werk makkelijker te maken.

Wikidata is een bron die feitelijke gegevens bevat over intussen al bijna 100 miljoen entiteiten of “data items”. Het is een vrij bewerkbare linked open dataset waaraan wereldwijd informatie wordt toegevoegd. Dat gebeurt deels handmatig en deels geautomatiseerd door import uit andere bronnen. Andere systemen kunnen daar ook weer gegevens aan ontlenen. En bovendien kunnen ook allerlei complexe analyses op de gegevens uitgevoerd worden. In de workshop van Hanno Lans, werken met Wikidata, wordt onder meer gekeken naar de mogelijkheden die Wikidata biedt om de datakwaliteit te verhogen van datasets van erfgoedinstellingen, met name gegevens van personen. Voor instellingen is het een groot voordeel dat de soms summiere informatie die in de eigen data aanwezig is, via dit kanaal verrijkt kan worden. In de workshop wordt aan de hand van de collecties van Paleis het Loo en Wereldculturen gekeken hoe op gestructureerde wijze data toegevoegd, gemonitord en teruggehaald kan worden. Ook wordt praktisch ingegaan op de werkwijze binnen Wikidata en wordt aandacht besteed aan handige hulpmiddelen zoals OpenRefine om zelf data te kunnen bewerken.

Hopelijk kan dit overzicht een beetje helpen bij het reduceren van de keuzestress die je wellicht voelt als je bij je aanmelding moet aanvinken welke onderdelen uit ons programma je 11 mei wilt volgen.

Een workshop?

Het workshop-programma voor 11 mei krijgt al aardig vorm. Het belooft ook flink afwisselend te worden (al blijft die afwisseling voor individuele deelnemers natuurlijk maar beperkt zichtbaar, want je kunt nu eenmaal niet meer dan twee workshops volgen). Die afwisseling uit zich ook in het feit dat we enerzijds een paar “gouwe ouwe” in de herhaling gezet hebben, maar er anderzijds ook een paar helemaal nieuwe workshops zijn, waarvan zowel de onderwerpen als de docenten nieuw zijn.

Die gouwe ouwe zijn de workshops van Ewoud Sanders (hoe je slimmer zoekt in Delpher), van Alexander Pleijter (hoe je factchecker wordt) en van Guus van den Brekel en Robin Ottjes (hoe je aan full-text artikelen komt). Omdat die workshops in het verleden steeds weer volgeboekt waren, verwachten we daar ook nu weer voldoende belangstellenden mee te trekken. Daar komt bij dat de workshop van Guus en Robin dit keer echt maar 1x gegeven zal worden, omdat zij zelf dit keer ook eindelijk wel eens wat van de rest van het programma willen volgen.

Helemaal nieuw is een workshop over Linked Open Data door een team van Triply dat zo’n workshop ook jaarlijks verzorgt voor het Platform Linked Data Nederland (PLDN). Nieuw in ons programma is ook de workshop van Sandra Fauconnier die deelnemers laat kennismaken met een open source data-opschoon tool OpenRefine. Het noemt zichzelf “a powerful tool for working with messy data“. Ook wie nog niet zo “technisch” is, kan in de workshop van Kristina Hettne kennis maken met eenvoudig zelf te programmeren tools, gebaseerd op het bekende “Librarycarpentry” concept, een soort “low- of no-coding” initiatief uit de biibliotheekwereld. Een vierde nieuw gezicht is Max Kemman die deelnemers wegwijs zal maken in methoden voor het analyseren van grote hoeveelheden tekstuele informatie.

En dan zijn er nog wat tussengevallen. Joyce van Aalten is al heel wat jaren actief bij VOGIN-IP, maar dit keer zal haar workshop gaan over het bouwen en gebruiken van knowledge graphs. Erik Elgersma komt weliswaar voor de tweede keer met zijn workshop over het opzetten van een informatieafdeling. maar is daarmee in onze ogen nog geen gouwe ouwe geworden.

Word je op basis hiervan al zo enthousiast dat je je meteen al zou willen aanmelden? Dan zul je toch nog even moeten wachten. Want dit lijstje is nog maar voorlopig; we zijn nog in onderhandeling met een paar meer workshopdocenten. Zodra meer bekend wordt, zal dat bijgewerkt worden op deze overzichtspagina. En ook de rest van het programma – de lezingen – willen we al verder klaar hebben voor we de inschrijving echt starten.

Het programma


Het programma voor de komende VOGIN-IP-lezing is nog niet klaar, maar er wordt wel hard aan gewerkt. Het vaste organiserende team is daartoe uitgebreid met een adviescommissie die vanuit verschillende achtergronden ideeën voor sprekers en workshops kan inbrengen en bespreken. Overleg vindt nog even via Zoom plaats. Maar ook dat blijkt heel inspirerend en vruchtbaar te kunnen zijn.
Het overleg heeft dan ook al geresulteerd in een flink aantal uitnodigingen aan potentiële sprekers en workshopdocenten. Voor de workshops zijn er zelfs al vijf toegezegd. Houdt hier onze berichten over de voortgang in de gaten.

Vorige week bij VOGIN-IP, morgen bij De Taalstaat


Bij de VOGIN-IP-lezing vorige week verzorgde Ewoud Sanders tweemaal zijn populaire workshop “Slimmer zoeken in Delpher”. Deze week kwam het bericht dat hem de prestigieuze Groenman Taalprijs is toegekend. Morgen is Ewoud daarom te gast bij het programma De Taalstaat op Radio 1 (11:00 – 13:00 uur), waarin juryvoorzitter Hans Heestermans hem de prijs zal overhandigen.

Ewoud krijgt de prijs toegekend voor de taalrubriek WoordHoek waarvan hij tussen 2000 en 2020 in NRC meer dan duizend afleveringen verzorgde. Sinds vorig jaar wordt deze rubriek gecontinueerd op de website van het Instituut voor de Nederlandse taal. Met deze rubriek, waarin hij vooral op de herkomst van woorden en uitdrukkingen inging, wist hij volgens de jury van de Groenman Taalprijs de lezers van de rubriek „liefde voor en kennis van de Nederlandse taal” bij te brengen. Hoewel in zijn workshop bij ons de nadruk natuurlijk op slimmer zoeken lag, zal daarbij ook vast wel iets van die liefde voor de taal zijn overgebracht. Bovendien heeft zoeken sowieso een heel “talige” dimensie.

Foto’s: Eef Evers

Ewoud is met deze toekenning in goed gezelschap. Eerder werd de prijs onder meer al uitgereikt aan Paul Witteman, Frits Spits, Kees van Kooten, Adriaan van Dis en Tom Lanoye.

Als VOGIN-IP-team feliciteren we Ewoud van harte met deze prijs.

Factchecked

Alexander Pleijter retweette gisteravond dit draadje (of zeg maar gerust “draad”) van een Vlaamse collega-factchecker, vergezeld van een zeer waarderend`commentaar. Inderdaad de moeite waard om die hele draad door te nemen. Daarin probeert Brecht Castel, naar aanleiding van een viraal antifaxers Facebook-bericht, antwoord te vinden op drie vragen: 1) Waar werd de foto genomen? 2) Wat is de context van de foto? En 3) Wie is deze vrouw en klopt haar boodschap?.
Maar daar hoef je het niet bij te laten als je beter toegerust wilt kunnen factchecken. Want Alexander Pleijter zelf verzorgt 21 oktober een twee uur durende workshop Zo word je factchecker waar nog veel meer algemene aanpak en tips en trucks aan de orde komen. Wel snel aanmelden, want het aantal plaatsen is beperkt.

Workshops in the making

Er komen al weer diverse interessante workshops aan voor het programma van 21 oktober, Vijf workshops zijn al definitief toegezegd en een paar zitten in de pijplijn.

In ons online programma vorig jaar was er veel belangstelling voor de workshop “Maak je eigen Infographic” van Joyce van Aalten. In de live situatie op 21 oktober zal ze een verdere verdieping op dat thema verzorgen.

Een heel nieuwe workshop in ons programma wordt gegeven door Erik Elgersma. In 2015 gaf hij al eens een zeer goed beoordeelde lezing over praktijkervaringen met de informatievoorziening bij Friesland-Campina. Nu zal hij je wegwijs maken hoe je als eenpitter een eigen informatiedienstverlening opzet.

De workshop van Egon Willighagen stond vorig jaar wel al op ons voorlopige programma, maar kon toen helaas niet gegeven worden. Je leert daarin te werken met twee interesssante projecten die de bruikbaarheid en toegankelijkheid van Wikidata sterk verbeteren: WikiCite en Scholia.

 Met alle nepnieuws dat rondwaart blijft factchecking een hot topic in ons vak. Op veler verzoek zal Alexander Pleijter, één van de drijvende krachten achter de site “Nieuwscheckers“,  dan ook opnieuw een workshop geven hoe je een (goede) factchecker wordt.

Een workshop “Slimmer zoeken in Delpher” werd al eens eerder gegeven, maar blijft de moeite waard nu in Delpher steeds meer gedigitaliseerde informatie beschikbaar is en de zoekmogelijkheden ook weer verbeterd zijn. Enig voorbehoud is op dit moment nog even dat niet definitief zeker is dat Ewoud Sanders op 21 oktober in het land zal zijn om die workshop te geven.

De workshop “Hoe kom ik nu aan de full-text?” is ook al eerder gegeven. Maar aangezien enerzijds steeds meer publicaties open access beschikbaar komen en nieuwe tools die vindbaar proberen te maken, en anderzijds de uitgevers blijven proberen hun betaalmuren ondoordringbaarder te maken, is een update zeker de moeite waard. Uiteraard zal die weer worden verzorgd door Guus van de Brekel, in samenwerking met Robin Ottjes.

Frank Huysmans zal de vorig jaar al aangekondigde workshop “Analyse van open data met open source software” verzorgen.

 

Bianca Kramer en Jeroen Bosman hebben in elk geval al toegezegd een workshop te verzorgen, maar beraden zich nog op een ander onderwerp dan dat wat ze afgelopen jaar al online verzorgd hebben.

Maar er zit nog meer in de pijplijn. Tegen de tijd dat de aanmelding voor de VOGIN-IP-lezing geopend wordt, zal er dus vast nog meer keuze zijn.