Informatie-oorlog


In de informatie die we over de lezing van Jelle van Haaster op onze site hebben staan, zat al een link naar een interview met hem dat in NRC heeft gestaan. Wat we gemist hadden, was dat hij afgelopen najaar nog in een ander artikel in NRC optrad. In de hier gelinkte webversie van 30 oktober overigens met een andere kop dan in de print/PDF-versie van 31 oktober die je hierboven ziet.
In dat stuk gaat Jelle van Haaster, zelf ook hobbygamer, nader in op de rol die games spelen in het bereiken, beïnvloeden en uiteindelijk werven van jeugdige strijders. Achter die games gaat volgens hem „een hele belevingswereld schuil, vol fora waar teksten en filmpjes worden gepost.”  Verder uit het artikel citerend:

Met zijn “moderne beeldtaal” drong IS heimelijk binnen in de psyche van beïnvloedbare jongeren, die ook via een app zagen hoe IS “voor de poorten van Bagdad” stond. Uiteindelijk zouden honderden jongeren – al dan niet beïnvloed door de oorlogsgame – in Syrië gaan vechten op een echt slagveld, tegen (bondgenoten van) Nederland. “Ik denk dat we dit fenomeen hebben onderschat.”

Meer daarover horen, rechtstreeks uit de mond van Van Haaster? Op donderdag 19 maart is hij één van de sprekers in de OBA.

Factchecking bij #voginip

Dit filmpje met interviews en uitspraken rond het thema factchecking en fake-nieuws (4:36 minuten met o.a. Christiaan Triebert en Alexander Pleijter) werd opgenomen tijdens de VOGIN-IP-lezing 2018. Het geeft nog altijd een goede impressie van de zaken waarmee zowel Alexander als Christiaan zich ook nu nog bezig houden. Bovendien geven zij beiden komend jaar ook weer acte de présence op de VOGIN-IP-lezing. Christiaan verzorgt een keynote, nu met voorbeelden uit de praktijk bij zijn huidige werkgever, de New York Times (zie bijv. deze video en deze web-publicatie). Alexander verzorgt, vanwege eerder succes, opnieuw een workshop “Zo word je factchecker”.

PS: … en wie wil terugzien hoe bij Bellingcat nieuws en feiten ontdekt worden, moet nog maar eens de VPRO documentaire “Bellingcat – Truth in a post-truth world” terugkijken, die vorige week in New York een Emmy Award won. In die film zie je Christiaan ook een aantal keren langskomen.

PS2: Er zijn trouwens nog meer filmpjes van #voginip-2018, die first-time-visitors alvast een goede indruk geven hoe het eraan toe pleegt te gaan bij de VOGIN-IP-lezing.

Dawn Anderson’s keynote:     BERT, NLP, IR & SEO

Ook de tweede #voginip keynote is vastgelegd. Dawn Anderson is in onze kringen misschien wat minder bekend, maar bij SEO-congressen is zij een veelgevraagd spreker, omdat zij de link weet te leggen tussen SEO en moderne information retrieval technieken. En daarmee dus ook tussen SEO en ons vakgebied. De titel van de presentatie die ze 26 november bij Search Solutions 2019 in Londen gaf, illustreert dat al aardig.

In dat kader heeft ze zich de laatste tijd ook verdiept in BERT, de nieuwe deep learning techniek voor betere natuurlijke taalverwerking – de niet-neurolinguistische NLP …..
In een eerdere post schreven we al al dat BERT zowel door Google als door Bing wordt toegepast. De omschrijving waar het acroniem BERT van afkomstig is, Bidirectional Encoder Representations from Transformers, blijft voor niet-informatici natuurlijk nogal mysterieus. Maar ook zonder daarvan de betekenis te begrijpen, is het zinvol om te weten dat de toepassing van BERT leidt tot een opmerkelijke verbetering van de relevantie van zoekresultaten. Vooral voor Bing wordt zo’n verbetering vaak gemeld. BERT maakt namelijk dat zoekmachines veel beter de betekenis van tekst “begrijpen”, zowel in zoekvragen als in gevonden webresultaten.

Wellicht dat Dawn zich wat extra tot deze nieuwe techniek aangetrokken voelt, omdat haar eigen bedrijf BERTey heet. En of dat bedrijf dan weer naar haar hond vernoemd is of omgekeerd, laten we hier maar even in het midden …..

Hoe dan ook, behalve bovenstaande presentatie bij PubCon, heeft Dawn begin november voor SearchEngineLand ook een lange bijdrage – voor niet-informatici – over BERT en NLP geschreven: A deep dive into BERT: How BERT launched a rocket into natural language understanding. Die vooraf dus maar even lezen.

Emmy en Christiaan

Dat de vorig jaar door VPRO uitgezonden documentaire over Bellingcat begin deze week in New York een Emmy Award ontving is intussen wel bekend. Dat net op dat moment Christiaan Triebert ook in Nederland was, was natuurlijk gelukkig toeval en voor Mathijs van Nieuwkerk een uitgelezen kans hem weer naar DWDD te halen.

Klik op image om video te starten

Klik op het image om DWDD-video fragment van gesprek met Christiaan te starten

Misschien ook wel jammer dat we nu gisteren al op TV gehoord en gezien hebben wat Christiaan ons 19 maart in zijn keynote bij #voginip gaat vertellen? Nee natuurlijk niet. Juist een prachtige promotie en stimulans om dan nog eens direct uit Christiaan’s mond, veel uitgebreider en live te kunnen horen hoe dit soort informatieanalyses in hun werk gaan, ook voor andere en op dat moment actuele gebeurtenissen. Want de bewijsvoering dat Syrische ziekenhuizen eerder dit jaar door systematische Russische bombardementen getroffen waren, was weer een fantastisch voorbeeld van het slim analyseren en combineren van gegevensbronnen. En dit keer dan niet door Bellingcat, maar door het New York Times Visual Investigation Team waar Christiaan tegenwoordig deel van uitmaakt.

nyt
Het verhaal over hun onderzoek kwam niet alleen in de gedrukte en web-versie van de New York Times terecht, maar ze hebben daar ook een video van gemaakt die je hieronder kunt bekijken.

En om de belangstelling nog meer te prikkelen, volgt hieronder ook een reeks tweets die Christiaan hier half november aan gewijd had.
Nog meer stimulans om Christiaan 19 maart niet te willen missen, zou je toch niet nodig moeten hebben.

1 september j.l. bij Buitenhof; maart 2020 bij VOGIN-IP


Het verheugt ons bijzonder al een eerste spreker voor de VOGIN-IP-lezing te kunnen aankondigen. Christiaan Triebert is een oude bekende. Het is al weer even geleden dat hij ons in een lezing en het jaar daarop in een workshop wegwijs heeft gemaakt in de analysetechnieken die hij voor Bellingcat toepaste om uit open bronnen allerlei gegevens af te leiden en die tot betekenisvolle informatie te combineren. Maar intussen is hij al weer enige tijd werkzaam bij de New York Times, waar hij deel uitmaakt van het visual investigation team. Hij kan ons nu dus vanuit een heel andere omgeving bijpraten over de rol van data uit hetzelfde soort open bronnen als Bellingcat gebruikt, bij de nieuwsgaring van dit mondiaal toonaangevende mediabedrijf. Daarbij zal ook aan de orde komen hoe ze die gegevens verwerken en de resultaten presenteren.
Wij blijken trouwens niet de enigen die hier graag over willen horen, want zondag 1 september j.l. was hij ook al te gast in het programma Buitenhof om hierover te vertellen. [HIER] kun je die hele uitzending nog terugkijken. Een kort fragment eruit zit in de tweet hieronder.

Het was niet toevallig dat Christiaan in Nederland was, want de volgende dag, bij de opening van het academisch jaar, mocht hij in Groningen als alumnus van het jaar de verzamelde hoogleraren en andere belangstellenden toespreken. Alle reden dus om in maart bij de VOGIN-IP-lezing Christiaan live te komen beluisteren.

Daan Odijk werkt graag met rijke content

Wordt gepubliceerd in IP 2019 nr. 2 [image]

Daan Odijk is lead data scientist bij RTL en promoveerde op een onderzoek naar algoritmes die zoeken naar nieuws. Tijdens de VOGIN-IP-lezing op 21 maart zal hij meer vertellen over de datatoepassingen die hij met zijn afdeling ontwikkelt.

Destijds bij Blendle werkte je aan gepersonaliseerde nieuwsbrieven, nu bij RTL lijkt dat weer het geval. Ben je gewoon doorgegaan met hetzelfde of is er toch wel verschil?
‘Mijn rol bij RTL is heel breed. Ik leid een team van data scientists en engineers die werken aan data-gedreven producten voor heel RTL. Een deel daarvan is personalisatie, maar er is heel veel meer, zoals bijvoorbeeld het voorspellen van kijkcijfers op tv en online of een diep directe interactie met consumenten, dat was waar ik bij Blendle plezier aan beleefde en nu bij RTL op een nog grotere schaal weer.‘

Personalisatie op basis van klikgedrag kan maken dat de lezer in een filterbubbel terecht komt. Hoe probeer je dat te voorkomen?
‘Het risico dat mensen alleen maar nieuws te lezen krijgen dat bij hun eigen wereldbeeld past heb je niet alleen bij personalisatie. Ook de keuze voor een krant (denk aan de verzuiling) en het promoten van populaire artikelen beperken de nieuwsconsumptie.‘
‘Ik vind het daarom belangrijk om nieuwspersonalisatie in nauwe samenwerking met de redactie te doen. Het aanbevelen van nieuws brengt een verantwoordelijkheid mee om bewust met deze risico’s om te gaan. Met de Universiteit van Amsterdam werken we daarom aan een onderzoeksproject (zie tinyurl.com/y4dtbsqz) om diversiteit in nieuwsaanbeveling beter meetbaar te maken.‘
‘Uiteindelijk maakt algoritmische personalisatie het juist mogelijk hier bewustere keuzes in te maken. In het wetenschappelijk onderzoek zien we dat personalisatie een positief effect kan hebben op de diversiteit aan aanbevelingen, vergeleken met bijvoorbeeld populair nieuws. Zo zagen we bij Blendle dat algoritmes om diversiteit in aanbevelingen te stimuleren zelfs op de lange termijn positief effect hadden op leesgedrag.‘

Heb je in je dagelijks werk nog voldoende gelegenheid om de snelle ontwikkelingen op jouw terrein te volgen en die ook in de praktijk toe te passen?
‘Jazeker. We zijn open over wat we doen en mijn vakgenoten bij andere mediabedrijven gelukkig ook. Daardoor leren we van elkaar en werken we samen met De Persgroep en het FD aan bijvoorbeeld open source tools voor het analyseren van tekst (github.com/rtl-nl/textpipe).’
‘Zelf kom ik maar beperkt toe aan het toepassen van nieuwe ontwikkelingen. Maar ik geef het team graag ruimte om nieuwe ontwikkelingen zelf uit te proberen. Daarnaast werken we veel samen met de universiteit en er lopen altijd wel studenten stage die frisse ideeën en technieken meebrengen.‘

RTL heeft destijds een aardige bijdrage ontvangen uit Google’s “Digital News Innovation Fund”. Heb jij daar ook van kunnen profiteren?
‘Ik was de aanvrager. Het idee is dat we, samen met de datajournalisten van RTL Nieuws, lokale nieuwsberichten gaan generen op basis van data. Waar een datajournalist nu een artikel schrijft met landelijk trends en eventueel een kaartje opneemt met lokale cijfers, willen we dat in dit project omdraaien. We genereren dan bijvoorbeeld een artikel over de veiligheid rondom de school bij jou om de hoek, dat leest alsof het handgeschreven is, maar eigenlijk een samenwerking is tussen journalist en algoritme.‘

Wat wordt de belangrijkste takeaway van je verhaal op de VOGIN-IP-lezing?
‘Ik wil laten zien waarom RTL, als mediabedrijf in transitie, een prachtige plek is om data science te bedrijven.‘

Bellingcat in Nederland

SKUP 2015
Eliot Higgins
Foto: Marius Nyheim Kristoffersen

Als lezer van deze blog wist je natuurlijk al dat Bellingcat, in de persoon van oprichter Eliot Higgins, op 21 maart in de OBA is om daar een keynote voor de VOGIN-IP-lezing te verzorgen. Dat Bellingcat als organisatie zich bovendien in Nederland vestigt, werd hier ook al eerder gemeld. Toch komen we daar nog even op terug omdat Eliot recent een hele thread van Twitterberichten gewijd heeft aan allerlei nieuwtjes , waaronder meer duidelijkheid over wat ze in Den Haag gaan doen. Hieronder de belangrijkste punten uit die thread van 17 februari:

Hopefully by the end of Spring we’ll have the new Bellingcat office in The Hague open and operational, which will be the centre of two new major projects, focused on Yemen and local training in The Netherlands.

With The Netherlands training project we’ll be running workshops to train locals from a wide variety of backgrounds, both social and professional, to work on projects that have an impact on their own lives, building a Dutch community of open source investigators.

And on Yemen we’ve been working to develop a systematic process of investigation and archiving of open source material focused on the use of our work in courts, both local and international, but with wider applications to different fields, including advocacy and journalism.

My hope is that by the end of 2019 we’ll have a complete process for the investigation & archiving open source material up to a standard that can be used by local & international courts that can be rapidly deployed internally to new conflicts, & shared with other organisations.

While we’re aiming for a standard that can be used in justice and accountability, the evidence and analysis we gather will also be used for other areas, such as journalism and advocacy. It’s all about creating a solid base that grows a variety of projects and outcomes.

We’re also looking at producing a podcast series about our MH17 investigation ahead of the 5th anniversary, and there’s also some other big things, some more personal to me, we’ll be announcing in the coming weeks.

If everything works out we’ll be making huge advancements in how open source investigation is used, developing incredibly archiving systems to make verified conflict information available to those who need it, and spreading what we’ve learnt to other organisations.

By the start of March we’ll have 16 full time members of staff working for Bellingcat, and we’re focusing on hiring staff for our Yemen research projects and admin staff. We’ll also have a 50/50 gender split in our staff, something I hope to sustain as we grow.

Als er niet toch al aanleiding was om 21 maart Eliot in Amsterdam te komen beluisteren, dan is dat er nu dus zeker.

Hoezo een knowledge graph?

Dat inhoudelijke ontsluiting nuttig is om informatie makkelijker vindbaar te maken voor klanten of voor andere geïnteresseerden, dat weet elke IP’er wel. Dat je daarvoor een taxonomie of een thesaurus kunt gebruiken is niets nieuws. Met een Knowledge Graph ligt dat nog wat anders. Vaak wordt zoiets nog gezien als het speeltje van Google, waarmee ze proberen concrete antwoorden op onze zoekvragen te geven. En eigenlijk ook een beetje als een tech-hype.
Toch zijn er steeds meer organisaties die hun eigen Enterprise Knowledge Graph ontwikkelen, omdat ze daar allerlei voordelen in zien. En die voordelen variëren van betere toegankelijkheid van hun informatie tot het krijgen van beter overzicht over hun eigen producten en de onderlinge relaties daartussen. Het is dus niet voor niets dat in ons programma zowel een lezing als een workshop aan dit onderwerp gewijd zijn.

In de workshop van Joyce van Aalten en Daphne Shinn leer je niet alleen hoe een Knowledge Graph werkt, maar ook hoe je er zelf een maakt – hands-on. Heel praktisch gericht dus.
In de lezing van Paula Kassenaar gaat het er vooral om hoe bij Zalando zo’n Knowledge Graph gebruikt wordt. Zowel ten behoeve van de klanten, zodat die makkelijker de producten kunnen vinden waar ze in geïnteresseerd zijn, als ten behoeve van het bedrijf zelf, om alle informatie over haar producten bij de hand te hebben. En uiteraard komt ook aan de orde hoe ze dat bij Zalando hebben aangepakt en hoe daar de graph wordt onderhouden.
Deze twee invalshoeken kun je ook nog combineren door ‘s ochtends de lezingen te bezoeken en ‘s middags naar die workshop te gaan.

Keuzestress


Wie naar de VOGIN-IP-lezing wil komen, moet de organisatoren daarvan wel haten. Want het is nogal pervers om beoogde bezoekers zo’n dosis keuzestress te bezorgen. Eerst al de keuze tussen lezingentracks en workshops. En dan nog: welk van die 10 workshops? Want die zien er allemaal interessant uit. Maar dat was natuurlijk ook de bedoeling van die organisatoren.
Niettemin hebben we één van hen gevraagd zich eens in zo’n bezoeker te verplaatsen. Wat zou hij kiezen als hij met dat aanmeldformulier voor zich zat. Eigenlijk wilde hij daar geen antwoord op geven, want dan zou hij de suggestie wekken de ene workshop voor te trekken boven de andere. Maar na enig aandringen wilde hij toch wel zeggen welke onderwerpen hem persoonlijk het meest aanspraken, Waarbij zijn belangrijkste criterium was over welke onderwerpen hij vond dat hij meer zou moeten weten.
Dan kwam bij hem op één: de workshop over Wikidata en SPARQL.
En op twee: de workshop over het bouwen van een Knowledge Graph.
Maar ja, over die semantische zoekmachines is natuurlijk ook wel leuk, of wat meer over SEO weten, en kunnen factchecken, of ….
En als hij dan een workshop koos, dan kon hij misschien weer niet naar Karsdorp’s lezing over de rap-generator of naar die over Zalando’s Knowledge Graph.
Zelfs bij deze gefingeerde keuzesituatie sloeg bij hem de stress al onbarmhartig toe.
Op basis van deze ervaring bieden de organisatoren u dus hun nederige excuses aan voor het veroorzaken van zoveel keuzestress.