Tripels

Op het plaatje hierboven zie je zes tripels. Maar slechts eentje daarvan komt op de VOGIN-IP-lezing aan de orde. Je mag zelf raden welke.
Over die ene soort tripels kun je dan wel op twee momenten iets te horen krijgen. In de beschrijving van de workshop van Martijn van der Kaaij worden die tripels expliciet genoemd. Het zijn de fundamentele beweringen waarmee dingen aan hun feitelijke eigenschappen worden gekoppeld. Zoals de bewering hierboven dat Karmeliet een Tripel is (maar dan van het andere soort). Martijn zal in zijn workshop vooral voorbeelden uit de erfgoedsector gebruiken om deze basisonderdelen van het semantisch web duidelijk te maken.
Dergelijke feitelijke beweringen in de vorm van tripels zijn ook de basis van Wikidata. Daarover komt Maarten Dammers namens Wikimedia NL een lezing geven. Wikidata is een enorm reservoir van feitelijke gegevens. Op dit moment zitten er meer dan 50 miljoen items in en nog wel wat meer tripels waarmee eigenschappen aan die items gekoppeld worden (zoals dat Karmeliet een Tripel is). Niet alleen ten behoeve van Wikipedia-lemma’s, maar ook voor ieder ander systeem kan daar via internet kennis aan ontleend worden. Hopelijk zal Maarten ook nog op de SPARQL-queries ingaan, waarmee je gericht gegevens kunt opvragen uit open systemen, zoals Wikidata, die data als tripels beschikbaar stellen. [Zie ook dit nieuwe artikel hierover: Bielefeldt, A., Gonsior, J., & Krötzsch, M. (2018). Practical Linked Data Access via SPARQL: The Case of Wikidata.]
Het is overigens goed je te realiseren dat Wikidata niet voor niets WIKIdata heet: iedereen kan er in principe gestructureerd gegevens aan toevoegen.

Achter de muur komen

Het Indiase e-magazine The Wire maakte zich een paar dagen geleden ook al kwaad dat Elsevier al die voor Indiase studenten onmisbare wetenschappelijke kennis achter betaalmuren stopt. Ook al heb je succes met zoeken en vinden, dan is dat meestal nog geen garantie voor “hebben of krijgen”. In het nogal polemische stuk in The Wire werd ook uitgebreid ingegaan op Sci-Hub en het vele gebruik van die piratensite om toch aan anders onbetaalbare wetenschappelijke artikelen te komen. En dat niet alleen vanuit minder kapitaalkrachtige landen, maar ook vanuit Europa en de VS. Maar eigenlijk zou de auteur zijn studenten niet naar zulke toch wat dubieuze sites willen verwijzen, waarvan het voortbestaan – mede door toedoen van de Elseviers van deze wereld – toch steeds wat onzeker is.
Hoewel we allemaal natuurlijk van harte hopen dat Open Access doorzet, zal voorlopig nog genoeg materiaal achter betaalmuren verdwijnen. En wat in het verleden al achter die muren geraakt is, komt daar vrijwel zeker niet zo snel meer achter vandaan. Vandaar dat allerlei methoden, tools en handigheidjes worden ontwikkeld om van artikelen die je nodig hebt, toch aan een gratis versie te komen. In eerste instantie liefst nog wel langs legale wegen. En intussen zijn er al zo veel van die wegen en methoden, dat UKB, het samenwerkingsverband van de Nederlandse Universiteits-bibliotheken en de KB, daar vorige week een nieuw overzicht van gepubliceerd heeft. Het is een lange PDF onder de naam “How to get the PDF” (al hoeven die artikelen lang niet altijd PDF’s te zijn). Toch blijkt zelfs die veelheid aan wegen nog regelmatig dood te lopen. Als nummer 12 op die lijst is daarom gelukkig toch ook Sci-Hub toegevoegd, de stormram van Alexandra Elbakyan waarmee bijna elke betaalmuur te slechten is.
Aan dat kunnen verkrijgen wat je gevonden hebt, wordt bij de VOGIN-IP-lezing ook aandacht besteed. In de workshop van Guus van den Brekel kunnen de deelnemers de methoden en tools om aan artikelen te komen zelf uitproberen. Ieder kan daarbij zelf kijken wat zijn of haar favoriete best-practice is. Neem daarvoor dus wel je laptop mee. Als je hier heen wilt en je hebt je nog niet aangemeld, doe dat dan snel, want de middagsessie van Guus is al volgeboekt.
[Het hier genoemde UKB-document is trouwens gebaseerd op een eerder door Guus voor de Universiteit Groningen gemaakt overzicht.]

Mijnen in een geflipt klaslokaal

De flipped classroom is een bij onderwijs en training plotseling veel gebruikte term. Gewone mensen zal die term misschien niet meteen veel zeggen. Toch wil Hugo Benne dat deelnemers aan zijn workshop “Tekst- en datamining” die methode gaan toepassen. Of liever gezegd: hij wil het op zijn deelnemers toepassen. Formeel houdt dat flippen van de classroom ongeveer in dat uitleg die normaal in de klas gegeven wordt, thuis vast bestudeerd moet worden en dat de oefeningen die normaal als huiswerk worden meegegeven, meteen in de klas worden gedaan. Nu ligt dat laatste bij ons soort workshops natuurlijk altijd al anders. Maar om meer tijd over te houden voor practisch oefenen, wordt van deelnemers aan de workshop “Tekst- en datamining” wel verwacht dat ze vooraf al een tekstje (de “theorie”) hebben gelezen en dat ze de voor het minen te gebruiken software vast op hun laptop geïnstalleerd hebben. Alleen zo kan onze eerdere toezegging “data-expert in twee uur” worden waargemaakt. Benodigde informatie om de classroom te kunnen flippen krijgen de deelnemers tijdig vooraf toegestuurd.
Voor deze workshop zijn nog plaatsen beschikbaar.uit artikel NRC https://www.nrc.nl/nieuws/2017/11/24/het-kan-data-expert-worden-in-een-dag-14211272-a1582519

Digital forensics: zoeken, verifiëren en analyseren

Het optreden van Christiaan Triebert bij DWDD had de 11-jarige Manu vorig jaar gemotiveerd om Bellingcat-technieken te willen toepassen voor een werkstuk voor school. Dat betrof nader onderzoek naar het illegaal oogsten van haaienvinnen. De Bellingcat gemeenschap heeft hem daar zelf ook nog wel wat bij geholpen. Dat liep uit op een geslaagd werkstuk plus een bezoekje van Christiaan, zoals bovenstaande foto laat zien.

Zou je als informatiespecialist die technieken eigenlijk niet ook al moeten beheersen? In de praktijk misschien toch nog niet echt. Want wat Bellingcat doet, is een mengsel van meer technieken en competenties dan waar de informatieprofessional meestal mee te maken heeft gehad. Een mengsel van bronnenkennis, zoektechniek, verificatie- en analysetechnieken en een heleboel recherche-achtige slimheid. In de workshop van Christiaan op 28 maart komen fundamenten daarvan aan de orde. In twee uur natuurlijk niet zo veel als in de vijfdaagse cursus die Bellingcat daar in diverse landen zelf voor organiseert (met o.a. Henk van Ess en Christiaan als docenten).

En wil je nu al testen of je die workshop van Christiaan nog nodig hebt, of dat je dit misschien toch al goed kunt? Er zijn allerlei online quizzen via Twitter waarin foto’s of video’s geanalyseerd moeten worden. Bellingcat heeft daar een mooi lijstje van: https://www.bellingcat.com/resources/2017/11/13/daily-verification-quizzes/
Zo is er elke dag van de week wel eentje:

  • #MondayQuiz: Julia Bayer (Deutsche Welle)
  • #TuesdayQuiz: Lars Wienand (Funke)
  • #WednesdayQuiz: Tilman Wagner (Deutsche Welle)
  • #ThursdayQuiz: Christiaan Triebert (Bellingcat)
  • #FridayQuiz: Marco Bereth (ZDF), Philipp Dudek (FVW), Fiete Stegers (NDR).

En als hulpmiddel hierbij kun je in elk geval gebruik maken van het overzicht van Bellingcat’s Digital Forensics Tools – A List of Open Source Verification and Investigation Tools and Methods.
Maar het is natuurlijk veel leuker om van Christiaan zelf te leren hoe je een foto of video relateert aan een locatie op Google Maps (of een andere bron voor satellietbeelden) en hoe je bepaalt wanneer die opname gemaakt is. Je zult dan wel wat simpeler voorbeelden krijgen dan meteen het lokaliseren van een foto van een vrachtauto met een Buk-raket of een video van de liquidatie van IS-strijders door een militieleider in Libië.

[Voor deze workshop is nog een aantal plaatsen beschikbaar, vooral in de ochtend]

En hoe doet de politie dat nou?

Een bericht van Arno Reuser:
Begin februari is een 18-jarige jongen opgepakt voor een DDoS aanval op de website van de belastingdienst. Hoe kom je er nu achter wie dat heeft gedaan? Hoe doen echte politiemensen echt onderzoek in sociale media, real-time, om boeven te vangen en strafbare feiten te vinden? Twee echte politiemensen die gepokt en gemazeld zijn in diepgravend onderzoek in onder andere sociale media komen in hun lezing vertellen en in hun workshop laten zien, hoe ze dat doen; de methoden en de technieken.
Uw kans voor een kijkje in de achterkamers van de nationale politie. Met echte politiemensen, uit de praktijk.

NB: De workshop van Rein Tellier & Elwin de Man is intussen al bijna volgeboekt.

AI vs. Automation Workshop by Joseph Busch

AI vs. Automation: Automated Tagging and Machine Learning Workshop
Voor belangstellenden hier vast de agenda van de workshop van Joseph Busch. [Propaganda voor zijn keynote stond al in onze vorige post]


Time Format Description Outcomes

30 min

Lecture

  • What is artificial intelligence, automated tagging, and machine learning.
  • Understand the key features and differences of AI, automated tagging, and machine learning.
  • 30 min

    Demo

  • Demo some natural language processing, entity extraction, and complex Boolean query tagging tools:
    – Lexalytics Semantria. [1]
    – Data Harmony Machine Aided Indexer (MAI) [2]
  • Understand the types of features that differentiate automated tagging tools, and the criteria for evaluating them.
  • 30 min

    Activity

  • Participate in a query building exercise working hands-on with tagging tools:
    – Lexalytics Semantria for Excel.
    – Data Harmony Machine Aided Indexer (MAI)
  • Obtain a practical understanding of how to build an automated classifier.
  • 30 min

    Lecture & demo

  • Review the pitfalls and benefits of machine learning in practice.
  • Demo Unsilo [3], an unsupervised machine learning tool.
  • Understand the differences between supervised and unsupervised machine learning.
  • Be aware of potential unintended consequences of unsupervised machine learning.
  • .

    Nep, fake en facts

    In de NRC van gisteren stond een lang interview met Peter Burger, specialist in broodje-aap verhalen en factchecking bij de Universiteit Leiden (en 2 jaar geleden ook al spreker op onze VOGIN-IP-lezing). Daarin waarschuwde hij tegen al te vergaande maatregelen tegen nepnieuws. Hoewel hij de verspreiding van desinformatie zeker niet wil bagatelliseren, denkt hij dat politici nu te makkelijk roepen dat maatregelen genomen moeten worden. „We weten niet precies hoeveel invloed deze desinformatie heeft, maar waarschijnlijk is die beperkt.” Harde bewijzen dat nepnieuws al veel kwaad gedaan heeft, zijn er volgens hem eigenlijk niet.
    Peter’s Leidse collega Alexander Pleijter (in de hierboven afgebeelde tweet), had vorige week bij EenVandaag op TV ook al stelling genomen tegen de manier waarop een EU anti-nep-bureau tot een veroordeling was gekomen van een aantal publicaties van meer of minder serieuze Nederlandse media. In deze uitzending komt Alexander na ongeveer 3 minuten aan het woord.
    Om te bepalen of nieuws nep en fake is, dienen natuurlijk de feiten gecheckt te worden. En daar zijn zowel Peter als Alexander specialist in. Samen begeleiden ze dan ook Nieuwscheckers, het factcheckproject waarin Leidse studenten journalistiek het waarheidsgehalte onderzoeken van allerlei nieuwsberichten – ook om Facebook bij te staan bij het bestrijden van nepnieuws.
    Dergelijke waarheidscontrole moet natuurlijk niet alleen bij “nieuws” gebeuren, maar eigenlijk ook bij elk soort bericht waarmee je als informatieprofessional in je professie te maken krijgt. Vandaar dat Alexander Pleijter ook bij ons een workshop “Zo word je factchecker” verzorgt. Zowel in het ochtend- als in het middagprogramma is voor zijn workshop nog een aantal plaatsen beschikbaar.

    Een workshop van Christiaan

    In de evaluatie van de VOGIN-IP-lezing van vorig jaar was Christiaan Triebert de best gewaardeerde spreker. Aan de door deelnemers uitgesproken wens langer dan 40 minuten van zijn ervaring te kunnen profiteren, komen we tegemoet door hem dit jaar een workshop te laten verzorgen.

    Sinds de lezing die hij vorig jaar bij ons gaf, is hij intussen veelvuldig in de media geweest. In een eerdere blogpost besteedden we al uitgebreid aandacht aan het feit dat hij de European Press Prize Innovation Award gewonnen had. Op 20 april mocht hij daarvoor ook bij DWDD aanschuiven.

    Op 26 juli werd op Eenvandaag TV “De zomer van… Christiaan Triebert” uitgezonden.

    Op 8 december werd op Eenvandaag Radio uitgebreid met Christiaan gesproken, vooral over nieuwe ontwikkelingen rond Bellingcat’s MH17 onderzoek. Dat gebeurde onder de titel

    ‘Bellingcat is eigenlijk Opsporing Verzocht 2.0’

    Daarnaast

  • verscheen op het Amerikaanse Online Pubishing Platform “Medium” een interview met Christiaan: There’s a lot Left to Uncover with Open Source Investigation – an interview with Check partner Bellingcat’s Christiaan Triebert,
  • werd op Villamedia aandacht aan hem besteed onder de titel “Een digitale Kuifje”,
  • werd hij in de Correspondent uitgebreid geciteerd onder de kop “Waarom we sociale media nog veel meer moeten inzetten als onderzoeksmiddel”,
  • ….
  • Alles bij elkaar heel wat redenen om nu in te schrijven voor de workshop die Christiaan 28 maart komt geven.

    Data expert in twee uur?

    Dit artikel uit NRC-Handelsblad van 25 november leidde op Twitter tot nogal wat boze reacties. Belachelijk om te suggereren dat je in één dag tot zoiets specialistisch als een data-expert opgeleid zou kunnen worden! Alsof het geen serieuze professie zou zijn.
    Toch gaan we 28 maart bij de VOGIN-IP-lezing nog een stapje verder. In een workshop van maar twee uur maken we je specialist in text- en datamining …..
    ???
    Nou okay, een specialist ben je dan misschien nog niet. Daarvoor is inderdaad veel meer tijd, inspanning en praktijkervaring nodig. Maar in de workshop van Hugo Benne maak je wel kennis met de basisprincipes en analysetools voor deze toepassing die ook voor informatieprofessionals steeds belangrijker wordt. Hugo vraagt deelnemers wel om thuis al wat voor te bereiden: software installeren en teksten lezen, zodat je 28 maart gedurende die twee uur meteen hands-on aan de slag kunt.

    [Aanmelden vanaf 16 januari]

    Over springbokken gesproken ….

    De VOGIN-IP-lezing is niet de enige die iets met springbokken heeft …..


    Had je al een idee voor onze Sprinbokkenworkshop?
    Uiterlijk 1 januari moet je aanmelding daarvoor bij ons binnen zijn op info@voginip.nl.

    En ….. vergeet de zeer-vroege-vogel-aanbieding niet!