Deepfakes – de keynote

Eind vorig jaar wees Arjen Lubach al eens op de gevaren van deepfakes. Als informatieprofessionals keken we daar natuurlijk niet heel erg van op. Toch gaan we bij de komende VOGIN-IP-lezing verder op dat thema in. En nog wel in één van onze keynotes, de laatst geboekte, waarover we jullie nog niet echt geïnformeerd hadden. Voor de keynote waarmee het programma ‘s ochtends geopend wordt, hebben we professor Zeno Geradts uitgenodigd. Hij is werkzaam bij het Nederlands Forensisch Instituut en is daarnaast bijzonder hoogleraar Forensic Data Science bij het Instituut voor Informatica van de UvA. Zijn lezing koppelt ook die twee instituten. Die werken namelijk samen in een net nieuw gestart project waarin technieken worden ontwikkeld waarmee automatisch kan worden herkend of een video een deepfake is. Nu de technieken om deepfakes te genereren steeds geavanceerder – en laagdrempeliger – worden, wordt het steeds moeilijker om ze nog met simpele technieken te herkennen.

Dat herkennen is wel zo’n beetje de heilige graal geworden voor zowel factcheckers als forensisch onderzoekers. Bij het Forensisch Instituut willen ze ten behoeve van juridische procedures bijvoorbeeld onomstotelijk kunnen bewijzen dat een bepaalde persoon werkelijk in een video voorkomt of dat die het in werkelijkheid niet is. Ook bij de verspreiding van nepnieuws spelen deepfakes steeds vaker een rol. Hoe weten we of een politicus of een BNer werkelijk de stuitende uitspraak heeft gedaan die je hem net hebt zien doen. Ook voor nieuws- en factcheckers is het dus van belang te kunnen bepalen of een video een deepfake is of dat hij echt is.

Beeld uit video van American Academy of Forensic Sciences – Is dit echt Zeno Geradts? 😉

Dit onderzoek berust voor een belangrijk deel op kunstmatige intelligentie en wordt dan ook uitgevoerd bij het Innovation Center for Artificial Intelligence, een nationaal netwerk waarin universiteiten, bedrijven en overheid samenwerken. Volgens Zeno Geradts zijn de huidige modellen voor het herkennen van deepfakes in staat om dat in zo’n 80% van de gevallen correct te doen, maar hij wil graag dat toch wel meer dan 99% eruit gevist kan worden. Er is dus nog genoeg werk te doen, des te meer omdat het een kat-en-muis spel is waarin snelle verbeteringen aan de maakkant moeten worden bijgehouden aan de detectiekant. Marcel Worring, de UvA-collega waarmee Zeno Geradts in dit project samenwerkt, memoreerde al dat van alle investeringen in deepfakes 90 procent gaat naar het verbeteren van de techniek om ze te maken en op dit moment maar 10 procent naar onderzoek om ze te herkennen.

Q&A met Ruben Verborgh

Uit het nieuwe nummer van IP (2018/2) een Q&A met keynote spreker Ruben Verborgh
.
Je waarschuwt dat blockchain ineens een hype is die overal bij betrokken wordt, of het nu zinnig is of niet. Maar je geeft ook aan dat in het domein van de informatieprofessional toepassingen mogelijk zijn. Wat zijn in het algemeen voorwaarden waaronder een blockchain-oplossing zinnig is?

Het hoofddoel van blockchain is om bindende akkoorden vast te leggen tussen meerdere partijen, zonder dat daarvoor vertrouwen nodig is in elkaar of in een centrale speler. We noemen dit gedistribueerde consensus. Het omgekeerde geldt echter ook: als partijen elkaar wel vertrouwen, of als ze al een centrale plek erkennen, dan hebben we wellicht geen blockchain nodig – zeker niet als er geen consensus nodig is. Bijvoorbeeld, als jij me een officieel bericht wilt sturen, kan je dit gewoon digitaal handtekenen, zonder blockchain.
Belangrijke randvoorwaarden voor zinnig gebruik zijn dus: meerdere partijen, afwezigheid van vertrouwen of autoriteit, en de noodzaak om tot een gezamenlijke waarheid te komen.

In je keynote ga je het hebben over toepassing van blockchain voor Linked Data. Wat maakt dat het daar dan wel zinnig kan zijn?

Linked Data is inherent ook gedistribueerd: elk stukje data kan op een andere plek staan. Blockchain kan dan nuttig zijn om vertrouwen te creëren in zo’n gedecentraliseerd netwerk van data. Omgekeerd kan Linked Data ook helpen met de beschrijving van data en afspraken binnen een blockchain, of met de interoperabiliteit tussen verschillende soorten blockchains. Dat klinkt nog wat ingewikkeld, maar in mijn lezing zal ik dat verder uitleggen.

Je hebt intussen ook een relatie gelegd met recente ideeën van jezelf en van Herbert van de Sompel voor volledig gedecentraliseerde systemen. Bijvoorbeeld een systeem van persoonlijke “datapods” waar ieder zijn eigen gegevens, publicaties, meningen etc. in kan stoppen *. Kun je hier al uitleggen wat dat met elkaar te maken heeft?

Het Web is op enkele jaren tijd sterk gecentraliseerd geraakt: steeds meer data komt in steeds minder verschillende platformen terecht, zoals bijvoorbeeld in Facebook. Langs de ene kant maakt zoiets een hele waaier aan intelligente services over die data mogelijk. Langs de andere kant zijn we zelf geen eigenaar van die intelligentie, en geven we bovendien ook de controle over onze data op. We kunnen ons dus de vraag stellen of dit een rechtvaardige prijs is.
Het idee achter persoonlijke datapods is dat we elk stukje data dat we genereren, in onze eigen opslagplek stoppen. Die bevat niet alleen data en metadata over onszelf en onze activiteiten, maar ook alle interacties met andere informatie. Als ik bijvoorbeeld een commentaar schrijf bij tekst in iemand anders datapod, dan wordt die commentaar bij mij opgeslagen en krijgt die ander bericht daarvan. De grote uitdaging is om toch een soortgelijke gebruikerservaring te bieden als in een gecentraliseerd systeem, ook al zitten deze stukjes data niet meer in één zo’n centraal platform. Voor de uitwisseling en verwerking van gegevens kunnen blockchains dan vertrouwensverbanden opzetten tussen verschillende persoonlijke datapods, onder meer als garantie voor de betrouwbaarheid en authenticiteit van de links tussen die componenten.

* zie: https://ruben.verborgh.org/blog/2017/12/20/paradigm-shifts-for-the-decentralized-web/
    en https://www.slideshare.net/hvdsomp/paul-evan-peters-lecture/