Workshops: wie is wie


Even een puzzeltje wie wie is? Dit zijn 12 docenten die op 19 maart 10 workshops verzorgen.
Wellicht wil je daar al meer over weten, om goed voorbereid te zijn op de keuzes die je binnenkort moet maken als de officiële inschrijving voor #voginip begint. HIER kun je al een sneak preview krijgen van alle op dit moment bekende workshops.
Of wordt het straks toch gewoon de dobbelsteen?

Factchecking bij #voginip

Dit filmpje met interviews en uitspraken rond het thema factchecking en fake-nieuws (4:36 minuten met o.a. Christiaan Triebert en Alexander Pleijter) werd opgenomen tijdens de VOGIN-IP-lezing 2018. Het geeft nog altijd een goede impressie van de zaken waarmee zowel Alexander als Christiaan zich ook nu nog bezig houden. Bovendien geven zij beiden komend jaar ook weer acte de présence op de VOGIN-IP-lezing. Christiaan verzorgt een keynote, nu met voorbeelden uit de praktijk bij zijn huidige werkgever, de New York Times (zie bijv. deze video en deze web-publicatie). Alexander verzorgt, vanwege eerder succes, opnieuw een workshop “Zo word je factchecker”.

PS: … en wie wil terugzien hoe bij Bellingcat nieuws en feiten ontdekt worden, moet nog maar eens de VPRO documentaire “Bellingcat – Truth in a post-truth world” terugkijken, die vorige week in New York een Emmy Award won. In die film zie je Christiaan ook een aantal keren langskomen.

PS2: Er zijn trouwens nog meer filmpjes van #voginip-2018, die first-time-visitors alvast een goede indruk geven hoe het eraan toe pleegt te gaan bij de VOGIN-IP-lezing.

Dawn Anderson’s keynote:     BERT, NLP, IR & SEO

Ook de tweede #voginip keynote is vastgelegd. Dawn Anderson is in onze kringen misschien wat minder bekend, maar bij SEO-congressen is zij een veelgevraagd spreker, omdat zij de link weet te leggen tussen SEO en moderne information retrieval technieken. En daarmee dus ook tussen SEO en ons vakgebied. De titel van de presentatie die ze 26 november bij Search Solutions 2019 in Londen gaf, illustreert dat al aardig.

In dat kader heeft ze zich de laatste tijd ook verdiept in BERT, de nieuwe deep learning techniek voor betere natuurlijke taalverwerking – de niet-neurolinguistische NLP …..
In een eerdere post schreven we al al dat BERT zowel door Google als door Bing wordt toegepast. De omschrijving waar het acroniem BERT van afkomstig is, Bidirectional Encoder Representations from Transformers, blijft voor niet-informatici natuurlijk nogal mysterieus. Maar ook zonder daarvan de betekenis te begrijpen, is het zinvol om te weten dat de toepassing van BERT leidt tot een opmerkelijke verbetering van de relevantie van zoekresultaten. Vooral voor Bing wordt zo’n verbetering vaak gemeld. BERT maakt namelijk dat zoekmachines veel beter de betekenis van tekst “begrijpen”, zowel in zoekvragen als in gevonden webresultaten.

Wellicht dat Dawn zich wat extra tot deze nieuwe techniek aangetrokken voelt, omdat haar eigen bedrijf BERTey heet. En of dat bedrijf dan weer naar haar hond vernoemd is of omgekeerd, laten we hier maar even in het midden …..

Hoe dan ook, behalve bovenstaande presentatie bij PubCon, heeft Dawn begin november voor SearchEngineLand ook een lange bijdrage – voor niet-informatici – over BERT en NLP geschreven: A deep dive into BERT: How BERT launched a rocket into natural language understanding. Die vooraf dus maar even lezen.

Emmy en Christiaan

Dat de vorig jaar door VPRO uitgezonden documentaire over Bellingcat begin deze week in New York een Emmy Award ontving is intussen wel bekend. Dat net op dat moment Christiaan Triebert ook in Nederland was, was natuurlijk gelukkig toeval en voor Mathijs van Nieuwkerk een uitgelezen kans hem weer naar DWDD te halen.

Klik op image om video te starten

Klik op het image om DWDD-video fragment van gesprek met Christiaan te starten

Misschien ook wel jammer dat we nu gisteren al op TV gehoord en gezien hebben wat Christiaan ons 19 maart in zijn keynote bij #voginip gaat vertellen? Nee natuurlijk niet. Juist een prachtige promotie en stimulans om dan nog eens direct uit Christiaan’s mond, veel uitgebreider en live te kunnen horen hoe dit soort informatieanalyses in hun werk gaan, ook voor andere en op dat moment actuele gebeurtenissen. Want de bewijsvoering dat Syrische ziekenhuizen eerder dit jaar door systematische Russische bombardementen getroffen waren, was weer een fantastisch voorbeeld van het slim analyseren en combineren van gegevensbronnen. En dit keer dan niet door Bellingcat, maar door het New York Times Visual Investigation Team waar Christiaan tegenwoordig deel van uitmaakt.

nyt
Het verhaal over hun onderzoek kwam niet alleen in de gedrukte en web-versie van de New York Times terecht, maar ze hebben daar ook een video van gemaakt die je hieronder kunt bekijken.

En om de belangstelling nog meer te prikkelen, volgt hieronder ook een reeks tweets die Christiaan hier half november aan gewijd had.
Nog meer stimulans om Christiaan 19 maart niet te willen missen, zou je toch niet nodig moeten hebben.

Do not use Google


In een eerdere blogpost citeerden we een blad waarin onze medeorganisator Arno Reuser geciteerd werd, dat we met Google moesten stoppen. Die opmerking van Arno was specifiek gericht op professionele zoekers. En terecht, want er is heel wat professioneel belangrijke informatie die je met Google niet kunt vinden. De meest voor de hand liggende reden daarvoor tekende het blad ook al op uit Arno’s mond: dat een heleboel serieuze informatie domweg “niet in Google zit”. Maar er is nog wel wat meer over te zeggen. Een heleboel dat wel in Google zit, vind je namelijk vaak ook niet meer. Daarbij spelen echter zaken die de gemiddelde journalistieke belangstelling wat te boven gaat. Vandaar dat ik beloofde er hier nog even op terug te komen.

Waar denk ik dan aan? De voornaamste reden is dat Google eigenlijk geen zoekmachine meer is, maar dat het een antwoordmachine is geworden. Dat houdt in dat Google probeert te begrijpen wat je eigenlijk met je zoekvraag bedoelt en daar antwoorden bij probeert te vinden. Daarbij wordt nu bijvoorbeeld BERT -Bidirectional Encoder Representations from Transformers JAWEL …..- natuurlijke taalverwerking technologie toegepast. Dat proberen te begrijpen is natuurlijk een loflijk streven, maar het betekent wel dat Google zoekvragen vaak herschrijft, waarbij met groot gemak zoekwoorden kunnen worden weggelaten of veranderd. En bij de inhoud van gevonden pagina’s wordt dat soort interpretatie ook toegepast. Zoekmachine Bing gebruikt BERT intussen trouwens ook.
Anders dan wat informatieprofessionals van zoeksystemen gewend zijn, hoeven getoonde zoekresultaten dus helemaal niet meer 1-op-1 overeen te komen met een ingetikte zoekvraag. Dat is natuurlijk prachtig voor “gewone” gebruikers, die Google als haar primaire doelgroep ziet. Die gebruikers zijn meestal alleen maar op zoek naar wat informatie over een onderwerp of een product, die nuttig en relevant is in hun eigen context en die daartoe vaak niet zulke correct geformuleerde zoekvragen formuleren. Maar voor professioneel gebruik, waar je vaak “alles” wilt hebben en waar de gebruiker al weet hoe die moet zoeken, is dat natuurlijk een ramp.

Wat dat in de praktijk inhoudt, wordt aardig geïllustreerd in een reeks tweets van @jeroenbosman eerder dit jaar. Die reeks begon met:

Hieronder een wat geredigeerde versie van dit draadje, inclusief enkele interessante reacties daarop.

The @Google web @search is now so limited it’s useless & dangerous for serious tasks. It finds you just ~200 pages with “climate crisis”: https://www.google.com/search?q=%22climate+crisis%22 … Why so few? Why these? What if one wants to check more than a few 100 pages containing a certain combination of words?

Christian Gutknecht‏ @chgutknecht:
hm.. the results of your query looks different to me. May you have another filter still activated?

Try to view more than a few hundred… Google never showed more than 1K results but last year reduced that even further to a very problematic few hundred.
Indeed. So much for Google’s broad and deep index. Of course you can add terms and still get a few hundreds, but sometimes you do not want that. Imagine wanting to find pages mentioning Plan S | cOAlition S and open access. You will get about 25% of what’s out there…

Lena Karvovskaya‏ @LangData:
As a follow-up on Jeroen’s critical twit about relying too much upon Google searches I thought I’d share this article about the intricacies and the limits of search. https://blogs.scientificamerican.com/observations/how-to-be-a-better-web-searcher-secrets-from-google-scientists/

Thanks, useful piece. Actually I do apply those tactics, but there are cases where they cannot be used to solve your problem. Suppose you wish to find all pages/post that mention “Plan S” or “cOAlition S”. There are at least 1200 pages known to Google that contain these terms, twice even. But you can not find them in a single search. You could trace them by consecutively guessing additional words that might appear in the pages, but that will inevitably create bias and still incomplete coverage. Only current solution is the date filter.

Lena Karvovskaya‏ @LangData:
Oh I see, you want ALL the pages. That’s not what google is made to do. There are ways to get around the limits: https://developers.google.com/webmaster-tools/search-console-api-original/v3/how-tos/all-your-data people who program can probably get even more results out of it

Relatie met de VOGIN-IP-lezing? In elk geval zal Jeroen Bosman op 19 maart weer een workshop verzorgen – al zal die dan niet over Google gaan. En we proberen nog te regelen dat één van de lezingen op BERT zal ingaan.

Eric Sieverts

Hulp nodig om geld op te maken?

spaarvaken - ShutterstockWerkt jouw organisatie met budgettoewijzingen per kalenderjaar. En is er geld voor jouw afdeling of in het opleidingenpotje, dat nog in 2019 moet worden opgemaakt? Dan kunnen wij je daarbij helpen. Want als je je nu al (voor)aanmeldt voor de VOGIN-IP-lezing 2020, dan kun je dit jaar nog de factuur krijgen. Dan moet die aanmelding natuurlijk wel tijdig bij ons binnen zijn, uiterlijk 6 december.
Dat is een mooie investering in de toekomst: je betaalt nu en hebt er straks profijt van. En als je het snel doet, profiteer je ook nog van het speciale zeervroegevogeltarief waarmee je ruim €100 bespaart. (… Zo komt dat geld dan nog weer niet op …)

Arno aan het woord


“stop met Google”

Op de komende VOGIN-IP-lezing dit keer geen workshop van Arno Reuser, en hij geeft ook al geen lezing. Op 19 maart heeft hij helaas al andere verplichtingen. Dat krijg je wanneer je OSINT-goeroe wordt. Maar gelukkig draagt hij, net als voorgaande jaren, nog wel bij aan de totstandkoming van ons programma voor die dag.
Daarom besteden we in deze blog dan maar wat extra aandacht aan hem. En vooral aan de presentatie die hij 30 oktober heeft gegeven op Infosecurity.nl, een vakbeurs en congres over (o.a.) IT-security. De website van Computable besteedt uitgebreid aandacht aan die lezing. Nou klinkt het ook wel uitdagend als je beweert dat mensen beter direct kunnen stoppen met het gebruik van Google. Ook al was dat zeker niet het enige en het belangrijkste dat Arno over OSINT te berde bracht, zo’n opmerking is voor een journalist natuurlijk wel een lekkere binnenkomer. Overigens zal onderstaande quote uit het Computable-verslag voor echte informatiespecialisten en OSINT-experts (en hopelijk ook voor vaste VOGIN-IP-bezoekers) niet zo heel opzienbarend meer zijn.

“Volgens de voormalige MIVD-medewerker kunnen bedrijven en organisaties het meeste profijt hebben van hun inlichtingenwerk als ze commerciële databronnen zoals bijvoorbeeld LexisNexis (digitaal doorzoekbare mediabronnen zoals kranten en magazines) koppelen aan de info van conventionele bibliotheken en informatie die online ook buiten het world wide web beschikbaar is. ‘Dan heb je een fantastische informatiepositie.’

Maar voor een willekeurige lezer van Computable of voor bezoekers aan dat congres sloeg deze boodschap van Arno waarschijnlijk wel in. Naast de hier weergegeven overwegingen van Arno, zijn er overigens nog wel meer argumenten om niet (alleen) op Google te vertrouwen als je professioneel naar informatie op zoek bent. In een latere blogpost zullen we daar nog wel even op terugkomen.

Om de video te bekijken die Computable over Arno heeft gemaakt, hoef je overigens niet noodzakelijkerwijs via de Computable-site, want ze hebben die ook op Youtube gezet. En daardoor is hij ook hieronder rechtstreeks te bekijken en te beluisteren.

Vanaf nu vooraanmelding voor zeer vroege vogels

Vanaf vandaag is de vooraanmelding voor zeer vroege vogels geopend.


Ook dit jaar heeft #voginip weer een voordelige aanbieding voor zeer vroege vogels.
Wie zich nu al durft aan te melden, zonder dat het programma bekend is, krijgt een flinke korting. Onze vaste bezoekers laten zich dat meestal geen tweemaal zeggen, want die weten uit ervaring dat ze daarmee geen risico lopen. Bovendien kun je deelname dan nog uit je 2019-budget betalen.

De eerste 75 zeer-vroege-vogel aanmelders tot en met 31 december (whatever comes first) betalen € 185. Wie geen gebruik kan maken van kortingtarief betaalt € 210. Voorwaarde is wel dat betaling uiterlijk 15 januari is ontvangen; anders wordt alsnog het dan geldende tarief in rekening gebracht. Het kortingtarief geldt voor wie al tweemaal eerder bij de VOGIN-IP-lezing is geweest, al eens een VOGIN-cursus heeft gevolgd, een abonnement op IP heeft of KNVI-lid is.
Een vooraanmeldformulier voor deze aanbieding vind je [hier].
Vanaf 1 januari begint de officiële inschrijving, waarbij je meteen je keuzes uit het dan gepubliceerde programma kunt maken. De daarvoor geldende (hogere) tarieven vind je op onze tarievenpagina.

Wie al iets over de tijden wil weten, vindt [hier] een voorlopig programmaschema.


 

Datum geprikt

De datum is geprikt: op donderdag 19 maart is de 8ste VOGIN-IP-lezing.

Op donderdag 19 maart organiseren VOGIN en vakblad IP gezamenlijk weer de VOGIN-IP-lezing. Ook dit keer weer in de OBA.

De formule van deze dag is misschien niet meer heel verrassend: een intensieve dag vol lezingen en workshops rond het ruime thema “zoeken en vinden van informatie”. Maar met de invulling komen wel elk jaar weer verrassende aspecten en invalshoeken aan de orde.
Daarmee is #voginip uitgegroeid tot het toonaangevende evenement voor iedereen die dagelijks professioneel met informatie bezig is. Het helpt je greep te houden op de nieuwste trends en ontwikkelingen in het informatievak en het biedt de mogelijkheid om met vakgenoten en specialisten ervaringen uit te wisselen.

Het evenement wordt ook dit keer weer in de OBA gehouden. Als je wilt zien hoe het in voorgaande jaren toeging, dan kun je onze filmclips uit 2018 nog eens bekijken of de foto’s die dit jaar zijn gemaakt. En natuurlijk zijn de presentaties van voorgaande jaren ook nog op deze site terug te vinden.

Intussen werken we druk aan het nieuwe programma. De eerste keynote spreker hadden we al aangekondigd: Christiaan Triebert. Eerder trad hij bij ons op namens Bellingcat, nu is hij als datajournalist verbonden aan de New York Times. Andere sprekers zitten al “in de pijplijn” en ook voor flink wat workshops hebben we al toezeggingen.
Zodra er verder nieuws is over sprekers en workshops, zullen we dat hier melden.
Binnenkort volgen ook mededelingen over aanmelding en tarieven.