Op deze blog hebben we wel al kort stil gestaan bij de workshops, voorzover die twee maanden geleden bekend waren. Maar we hadden nog weinig over het lezingenprogramma gemeld, terwijl de inschrijving voor ons congres toch al heel snel gaat starten. Daarom nu wat meer daarover.

Van de beoogde sprekers ontbreekt er op dit moment nog eentje. Dat betekent dat we in elk geval al één van onze keynote sprekers bij jullie kunnen introduceren. Dat is professor Antal van de Bosch. Ooit, bij de eerste VOGIN-IP-lezing in 2013, heeft hij ook al eens een lezing verzorgd. Intussen zijn we acht jaar verder en is hij nu directeur van het Meertensinstituut van de KNAW en sinds kort hoogleraar bij de UVA. Daar doet hij uiteraard al weer andere dingen dan in 2013, zodat we zeer benieuwd zijn wat hij nu te vertellen heeft.
Zijn lezing zal gaan over een onderwerp dat we in de afgelaste 2020 editie ook al gepland hadden. Dat betreft taalmodellen waarmee bijvoorbeeld automatisch teksten gegenereerd kunnen worden, of waarmee voorspeld kan worden wat er op een gegeven tekst kan volgen. Dergelijke taalmodellen zijn gebaseerd op kunstmatige intelligentie en machine learning, waarbij de software gevoed wordt met onvoorstelbaar omvangrijke tekstcorpora. Ook grote zoekmachines maken steeds meer gebruik van dit soort technieken, bijvoorbeeld om te voorspellen wat gebruikers (zeer waarschijnlijk) met hun zoekvragen bedoelen.
De eerste techniek waarvan de vakbladen drie jaar geleden vol stonden, was BERT. Onder meer Google had daarvoor belangrijke toepassingen ontwikkeld. Over de wat raadselachtige omschrijving waarvan BERT het acroniem was – Bidirectional Encoder Representations from Transformers – schreven we in 2019 al eens blogposts (HIER en HIER), voorafgaand aan die 2020 editie.

Intussen is er nog weer een nieuwere variant, GPT-3 (Generative Pre-trained Transformer, version 3) die nog krachtiger is en voor nog weer meer toepassingen gebruikt moet kunnen worden. In een artikel in NRC hierover mocht Antal van den Bosch daar al één en ander over vertellen. We zijn dus heel blij dat hij 21 oktober ons daarover komt bijpraten op een manier die ook begrijpelijk is voor toehoorders die geen informaticus of taaltechnoloog zijn.
Informatie over de zes gewone lezingen uit ons programma kun je in voorlopige versie ook al op onze website bekijken. Alleen de tweede keynote spreker ontbreekt daar dus nog.




Om te beginnen is er, in samenwerking met LexisNexis een workshop waarin je, aan de hand van hun zoekspecialist Marlies Segers, beter leert zoeken in het nieuws dat LexisNexis online aanbiedt. De (Nederlandse) verkiezingen van komend voorjaar worden daarbij als leidende casus gebruikt. Die workshop is al op
Op
Op
En last but not least in deze opsomming – en op de kalender al eerder dan de lezing van Bianca – is er een workshop van Arno Reuser. Daarmee komen we tegemoet aan een in eerdere evaluaties vaak uitgesproken wens. Hij zal op de hem eigen wijze ingaan op de basisprincipes van goed gestructureerd zoeken, waarvoor Booleaanse methoden nog altijd de grondslag vormen. Wel basisprincipes, maar zeker geen basale workshop. Op 




Ook de tweede #voginip keynote is vastgelegd. Dawn Anderson is in onze kringen misschien wat minder bekend, maar bij SEO-congressen is zij een veelgevraagd spreker, omdat zij de link weet te leggen tussen SEO en moderne information retrieval technieken. En daarmee dus ook tussen SEO en ons vakgebied. De titel van de presentatie die ze 26 november bij 

