Digital forensics: zoeken, verifiëren en analyseren

Het optreden van Christiaan Triebert bij DWDD had de 11-jarige Manu vorig jaar gemotiveerd om Bellingcat-technieken te willen toepassen voor een werkstuk voor school. Dat betrof nader onderzoek naar het illegaal oogsten van haaienvinnen. De Bellingcat gemeenschap heeft hem daar zelf ook nog wel wat bij geholpen. Dat liep uit op een geslaagd werkstuk plus een bezoekje van Christiaan, zoals bovenstaande foto laat zien.

Zou je als informatiespecialist die technieken eigenlijk niet ook al moeten beheersen? In de praktijk misschien toch nog niet echt. Want wat Bellingcat doet, is een mengsel van meer technieken en competenties dan waar de informatieprofessional meestal mee te maken heeft gehad. Een mengsel van bronnenkennis, zoektechniek, verificatie- en analysetechnieken en een heleboel recherche-achtige slimheid. In de workshop van Christiaan op 28 maart komen fundamenten daarvan aan de orde. In twee uur natuurlijk niet zo veel als in de vijfdaagse cursus die Bellingcat daar in diverse landen zelf voor organiseert (met o.a. Henk van Ess en Christiaan als docenten).

En wil je nu al testen of je die workshop van Christiaan nog nodig hebt, of dat je dit misschien toch al goed kunt? Er zijn allerlei online quizzen via Twitter waarin foto’s of video’s geanalyseerd moeten worden. Bellingcat heeft daar een mooi lijstje van: https://www.bellingcat.com/resources/2017/11/13/daily-verification-quizzes/
Zo is er elke dag van de week wel eentje:

  • #MondayQuiz: Julia Bayer (Deutsche Welle)
  • #TuesdayQuiz: Lars Wienand (Funke)
  • #WednesdayQuiz: Tilman Wagner (Deutsche Welle)
  • #ThursdayQuiz: Christiaan Triebert (Bellingcat)
  • #FridayQuiz: Marco Bereth (ZDF), Philipp Dudek (FVW), Fiete Stegers (NDR).

En als hulpmiddel hierbij kun je in elk geval gebruik maken van het overzicht van Bellingcat’s Digital Forensics Tools – A List of Open Source Verification and Investigation Tools and Methods.
Maar het is natuurlijk veel leuker om van Christiaan zelf te leren hoe je een foto of video relateert aan een locatie op Google Maps (of een andere bron voor satellietbeelden) en hoe je bepaalt wanneer die opname gemaakt is. Je zult dan wel wat simpeler voorbeelden krijgen dan meteen het lokaliseren van een foto van een vrachtauto met een Buk-raket of een video van de liquidatie van IS-strijders door een militieleider in Libië.

[Voor deze workshop is nog een aantal plaatsen beschikbaar, vooral in de ochtend]

Speaker in the spotlight: David Graus

Afgelopen zomer is David Graus gepromoveerd op een proefschrift “Entities of interest : Discovery in digital traces“. Zoals die (onder)titel al aangeeft, heeft hij daarin onderzoek gedaan naar de sporen die we voortdurend op internet achterlaten. Hij ontwikkelde daartoe rekenmethodes om die grote hoeveelheden gegevens (echte “big data”) te analyseren en te exploreren teneinde daar betekenis in te ontdekken. En een van de doelen daarvan is om uiteindelijk op basis van gegevens uit het verleden, iemands toekomstige activiteiten te kunnen voorspellen. Resultaten uit het verleden moeten zo dus wel garantie voor de toekomst gaan bieden.

Onder de kop Deze promovendus weet alles over jouw online voetafdruk schreef het Amsterdamse universiteitsblad Folia over David’s promotie dat hij

“zich met name bewust geworden [is] van de voordelen van het achterlaten van digitale sporen. ‘Mensen zien het als iets negatiefs, maar nemen de positieve dingen voor lief. Het is een transactie. Een site als Google zou veel minder goed werken als het ons gedrag niet zou monitoren.’ “

Op dit soort onderwerpen – en de spanning die er natuurlijk wel is tussen dergelijke personalisatie en privacy – zal David ook ingaan in zijn lezing in het lezingentrack in de ochtend op 28 maart.

Intussen werkt David bij de FD Mediagroep, het bedrijf achter onder meer Het Financieele Dagblad en BNR Nieuwsradio. Ook daar werkt hij aan dit soort onderwerpen, zoals blijkt uit zijn recente artikel op de Company.info-blog over “Machine learning en voorspellende inzichten uit bedrijfsinformatie“.
Vorige week meldde David ook dat een artikel dat hij nog bij de UVA, samen met Daan Odijk en Maarten de Rijke geschreven had, eindelijk in JASIST gepubliceerd was: The birth of collective memories: Analyzing emerging entities in text streams.
En dat is in Open Access! 😉

En hoe doet de politie dat nou?

Een bericht van Arno Reuser:
Begin februari is een 18-jarige jongen opgepakt voor een DDoS aanval op de website van de belastingdienst. Hoe kom je er nu achter wie dat heeft gedaan? Hoe doen echte politiemensen echt onderzoek in sociale media, real-time, om boeven te vangen en strafbare feiten te vinden? Twee echte politiemensen die gepokt en gemazeld zijn in diepgravend onderzoek in onder andere sociale media komen in hun lezing vertellen en in hun workshop laten zien, hoe ze dat doen; de methoden en de technieken.
Uw kans voor een kijkje in de achterkamers van de nationale politie. Met echte politiemensen, uit de praktijk.

NB: De workshop van Rein Tellier & Elwin de Man is intussen al bijna volgeboekt.

AI vs. Automation Workshop by Joseph Busch

AI vs. Automation: Automated Tagging and Machine Learning Workshop
Voor belangstellenden hier vast de agenda van de workshop van Joseph Busch. [Propaganda voor zijn keynote stond al in onze vorige post]

Time Format Description Outcomes

30 min

Lecture

  • What is artificial intelligence, automated tagging, and machine learning.
  • Understand the key features and differences of AI, automated tagging, and machine learning.
  • 30 min

    Demo

  • Demo some natural language processing, entity extraction, and complex Boolean query tagging tools:
    – Lexalytics Semantria. [1]
    – Data Harmony Machine Aided Indexer (MAI) [2]
  • Understand the types of features that differentiate automated tagging tools, and the criteria for evaluating them.
  • 30 min

    Activity

  • Participate in a query building exercise working hands-on with tagging tools:
    – Lexalytics Semantria for Excel.
    – Data Harmony Machine Aided Indexer (MAI)
  • Obtain a practical understanding of how to build an automated classifier.
  • 30 min

    Lecture & demo

  • Review the pitfalls and benefits of machine learning in practice.
  • Demo Unsilo [3], an unsupervised machine learning tool.
  • Understand the differences between supervised and unsupervised machine learning.
  • Be aware of potential unintended consequences of unsupervised machine learning.
  • .

    Dit zijn ze dan

    Dit zijn de negen sprekers die 28 maart in acht lezingen aan het woord komen; met linksboven en rechtsonder onze keynote sprekers. In elk geval om te zien is het al een afwisselend gezelschap. Wie preciezer wil weten waar ze het over gaan hebben (en wie ze zijn), moet de teksten op onze lezingenpagina maar eens zorgvuldig doornemen.
    Als je bij hun lezingen wilt zijn, moet je je natuurlijk tijdig aanmelden voor deze dag (als je dat niet al gedaan hebt). En daarbij heb je dan nog de moeilijke keuze of je bij een lezingentrack wilt zijn of bij een van de minstens even interessante workshops die je ook nog kunt volgen. Kijk maar naar het programma.
    Een ware “embarras du choix” oftewel keuzestress.

    Nep, fake en facts

    In de NRC van gisteren stond een lang interview met Peter Burger, specialist in broodje-aap verhalen en factchecking bij de Universiteit Leiden (en 2 jaar geleden ook al spreker op onze VOGIN-IP-lezing). Daarin waarschuwde hij tegen al te vergaande maatregelen tegen nepnieuws. Hoewel hij de verspreiding van desinformatie zeker niet wil bagatelliseren, denkt hij dat politici nu te makkelijk roepen dat maatregelen genomen moeten worden. „We weten niet precies hoeveel invloed deze desinformatie heeft, maar waarschijnlijk is die beperkt.” Harde bewijzen dat nepnieuws al veel kwaad gedaan heeft, zijn er volgens hem eigenlijk niet.
    Peter’s Leidse collega Alexander Pleijter (in de hierboven afgebeelde tweet), had vorige week bij EenVandaag op TV ook al stelling genomen tegen de manier waarop een EU anti-nep-bureau tot een veroordeling was gekomen van een aantal publicaties van meer of minder serieuze Nederlandse media. In deze uitzending komt Alexander na ongeveer 3 minuten aan het woord.
    Om te bepalen of nieuws nep en fake is, dienen natuurlijk de feiten gecheckt te worden. En daar zijn zowel Peter als Alexander specialist in. Samen begeleiden ze dan ook Nieuwscheckers, het factcheckproject waarin Leidse studenten journalistiek het waarheidsgehalte onderzoeken van allerlei nieuwsberichten – ook om Facebook bij te staan bij het bestrijden van nepnieuws.
    Dergelijke waarheidscontrole moet natuurlijk niet alleen bij “nieuws” gebeuren, maar eigenlijk ook bij elk soort bericht waarmee je als informatieprofessional in je professie te maken krijgt. Vandaar dat Alexander Pleijter ook bij ons een workshop “Zo word je factchecker” verzorgt. Zowel in het ochtend- als in het middagprogramma is voor zijn workshop nog een aantal plaatsen beschikbaar.

    Speaker Spotlight: Suzan Verberne


    Als je leest waar Suzan (@suzan) Verberne zich mee bezig houdt in haar tegenwoordige functie bij de Universiteit Leiden, kom je veelvuldig het begrip text mining tegen. Waarom gaat ze het bij ons dan hebben over het automatisch classificeren van tekstuele informatie? Dat is niet zo gek als het misschien lijkt, want te classificeren teksten moeten daarvoor ook eerst gemined worden. Bij steeds meer praktische toepassingen zie je dergelijke technieken terugkomen.
    Dat Suzan niet alleen puur wetenschappelijk gefocust is, blijkt wel uit het feit dat ze vorige maand bij de Universiteit van Nederland ook een college voor een algemeen publiek heeft verzorgd. Onder de spannende titel “Maakte Rembrandt wel eens een lachende selfie?” komen daarin allerlei aspecten van zoeken aan de orde. Het is zeker de moeite waard om dit college al eens af te spelen. Het maakt meteen enthousiast om ook haar lezing in het ochtendprogramma van de VOGIN-IP-lezing te willen bijwonen, want die zal natuurlijk veel meer op zoekspecialisten zoals wij gericht zijn. En … bij ons heeft ze natuurlijk heel wat langer dan tien minuten de tijd om haar punt te maken.

    IP in een nieuw jasje

    Ons vakblad IP, medeorganisator van de VOGIN-IP-lezing, heeft met ingang van het eerste nummer in 2018 een nieuwe vormgeving gekregen. Een blik op de geheel vernieuwde buitenkant kunnen we je hier al presenteren. Voor het binnenwerk moet je nog even wachten tot dat eerste nummer binnenkort bij je in de bus ligt. En dat laatste geldt voor iedereen, want als je nog geen abonnee bent, kun je nu gebruik maken van een speciaal voordelig introductieaanbod.