Tripels

Op het plaatje hierboven zie je zes tripels. Maar slechts eentje daarvan komt op de VOGIN-IP-lezing aan de orde. Je mag zelf raden welke.
Over die ene soort tripels kun je dan wel op twee momenten iets te horen krijgen. In de beschrijving van de workshop van Martijn van der Kaaij worden die tripels expliciet genoemd. Het zijn de fundamentele beweringen waarmee dingen aan hun feitelijke eigenschappen worden gekoppeld. Zoals de bewering hierboven dat Karmeliet een Tripel is (maar dan van het andere soort). Martijn zal in zijn workshop vooral voorbeelden uit de erfgoedsector gebruiken om deze basisonderdelen van het semantisch web duidelijk te maken.
Dergelijke feitelijke beweringen in de vorm van tripels zijn ook de basis van Wikidata. Daarover komt Maarten Dammers namens Wikimedia NL een lezing geven. Wikidata is een enorm reservoir van feitelijke gegevens. Op dit moment zitten er meer dan 50 miljoen items in en nog wel wat meer tripels waarmee eigenschappen aan die items gekoppeld worden (zoals dat Karmeliet een Tripel is). Niet alleen ten behoeve van Wikipedia-lemma’s, maar ook voor ieder ander systeem kan daar via internet kennis aan ontleend worden. Hopelijk zal Maarten ook nog op de SPARQL-queries ingaan, waarmee je gericht gegevens kunt opvragen uit open systemen, zoals Wikidata, die data als tripels beschikbaar stellen. [Zie ook dit nieuwe artikel hierover: Bielefeldt, A., Gonsior, J., & Krötzsch, M. (2018). Practical Linked Data Access via SPARQL: The Case of Wikidata.]
Het is overigens goed je te realiseren dat Wikidata niet voor niets WIKIdata heet: iedereen kan er in principe gestructureerd gegevens aan toevoegen.

Achter de muur komen

Het Indiase e-magazine The Wire maakte zich een paar dagen geleden ook al kwaad dat Elsevier al die voor Indiase studenten onmisbare wetenschappelijke kennis achter betaalmuren stopt. Ook al heb je succes met zoeken en vinden, dan is dat meestal nog geen garantie voor “hebben of krijgen”. In het nogal polemische stuk in The Wire werd ook uitgebreid ingegaan op Sci-Hub en het vele gebruik van die piratensite om toch aan anders onbetaalbare wetenschappelijke artikelen te komen. En dat niet alleen vanuit minder kapitaalkrachtige landen, maar ook vanuit Europa en de VS. Maar eigenlijk zou de auteur zijn studenten niet naar zulke toch wat dubieuze sites willen verwijzen, waarvan het voortbestaan – mede door toedoen van de Elseviers van deze wereld – toch steeds wat onzeker is.
Hoewel we allemaal natuurlijk van harte hopen dat Open Access doorzet, zal voorlopig nog genoeg materiaal achter betaalmuren verdwijnen. En wat in het verleden al achter die muren geraakt is, komt daar vrijwel zeker niet zo snel meer achter vandaan. Vandaar dat allerlei methoden, tools en handigheidjes worden ontwikkeld om van artikelen die je nodig hebt, toch aan een gratis versie te komen. In eerste instantie liefst nog wel langs legale wegen. En intussen zijn er al zo veel van die wegen en methoden, dat UKB, het samenwerkingsverband van de Nederlandse Universiteits-bibliotheken en de KB, daar vorige week een nieuw overzicht van gepubliceerd heeft. Het is een lange PDF onder de naam “How to get the PDF” (al hoeven die artikelen lang niet altijd PDF’s te zijn). Toch blijkt zelfs die veelheid aan wegen nog regelmatig dood te lopen. Als nummer 12 op die lijst is daarom gelukkig toch ook Sci-Hub toegevoegd, de stormram van Alexandra Elbakyan waarmee bijna elke betaalmuur te slechten is.
Aan dat kunnen verkrijgen wat je gevonden hebt, wordt bij de VOGIN-IP-lezing ook aandacht besteed. In de workshop van Guus van den Brekel kunnen de deelnemers de methoden en tools om aan artikelen te komen zelf uitproberen. Ieder kan daarbij zelf kijken wat zijn of haar favoriete best-practice is. Neem daarvoor dus wel je laptop mee. Als je hier heen wilt en je hebt je nog niet aangemeld, doe dat dan snel, want de middagsessie van Guus is al volgeboekt.
[Het hier genoemde UKB-document is trouwens gebaseerd op een eerder door Guus voor de Universiteit Groningen gemaakt overzicht.]

VOGIN-cursus

VOGIN is niet alleen een van de organisatoren van de VOGIN-IP-lezing, maar verzorgt ook al sinds 1978 (!!) tweemaal per jaar een meerdaagse cursus “Online opsporen van informatie”. De inhoud van die cursus gaat tegenwoordig al heel wat verder dan alleen maar “zoeken en vinden” (het “opsporen” uit de titel). Het globale programma-overzicht van de komende voorjaarscursus geeft daar al een aardige indruk van:

5 DAAGSE VOGIN-CURSUS ONLINE OPSPOREN VAN INFORMATIE
(8, 9, 14, 15, 31 MEI 2018; 79ste EDITIE)

Programma:
Dag 1: Rol van de informatiespecialist; overzicht van het actuele informatielandschap; werken met Wikipedia en webzoekmachines
Dag 2: Gestructureerde zoeksystemen; meer succes met systematisch opgezette zoekacties; evalueren en verbeteren van zoekresultaten.
Dag 3: Nieuws, sociale media, image search, factchecking; gebruik van RSS/mashups en kennis van API’s.
Dag 4: Wetenschappelijke informatiesystemen; geavanceerd zoeken met citatiedatabases; impact en metrics; tekst- en data-mining.
Dag 5: Open Science en onderzoeksondersteuning.

Het gedetailleerde programma (plus lesmateriaal) van de vorige editie, is beschikbaar via https://tinyurl.com/vogincursus
Maar gezien de snelle veranderingen in het informatielandschap, zal de komende cursus er op een aantal punten al weer anders uitzien. Zo zal de nieuwe VOGIN-docent Hugo Benne die tijdens de VOGIN-IP-lezing op 28 maart een workshop over tekst- en datamining verzorgt, dat onderwerp ook in de VOGIN-cursus introduceren (dag 4).

Als je op de VOGIN-IP-lezing de smaak van het zoeken en vinden te pakken krijgt, dompel je dan ook eens onder in deze intensieve cursus. Meer informatie: https://www.vogin.nl/academie/cursussen/
Aanmelden:

  • per mail:   msu.library@wur.nl   (+ graag cc. aan   jeroensbox@gmail.com)
  • per telefoon:   0317 – 485479   (mevr. J. Smelik)
  • Mijnen in een geflipt klaslokaal

    De flipped classroom is een bij onderwijs en training plotseling veel gebruikte term. Gewone mensen zal die term misschien niet meteen veel zeggen. Toch wil Hugo Benne dat deelnemers aan zijn workshop “Tekst- en datamining” die methode gaan toepassen. Of liever gezegd: hij wil het op zijn deelnemers toepassen. Formeel houdt dat flippen van de classroom ongeveer in dat uitleg die normaal in de klas gegeven wordt, thuis vast bestudeerd moet worden en dat de oefeningen die normaal als huiswerk worden meegegeven, meteen in de klas worden gedaan. Nu ligt dat laatste bij ons soort workshops natuurlijk altijd al anders. Maar om meer tijd over te houden voor practisch oefenen, wordt van deelnemers aan de workshop “Tekst- en datamining” wel verwacht dat ze vooraf al een tekstje (de “theorie”) hebben gelezen en dat ze de voor het minen te gebruiken software vast op hun laptop geïnstalleerd hebben. Alleen zo kan onze eerdere toezegging “data-expert in twee uur” worden waargemaakt. Benodigde informatie om de classroom te kunnen flippen krijgen de deelnemers tijdig vooraf toegestuurd.
    Voor deze workshop zijn nog plaatsen beschikbaar.uit artikel NRC https://www.nrc.nl/nieuws/2017/11/24/het-kan-data-expert-worden-in-een-dag-14211272-a1582519

    Digital forensics: zoeken, verifiëren en analyseren

    Het optreden van Christiaan Triebert bij DWDD had de 11-jarige Manu vorig jaar gemotiveerd om Bellingcat-technieken te willen toepassen voor een werkstuk voor school. Dat betrof nader onderzoek naar het illegaal oogsten van haaienvinnen. De Bellingcat gemeenschap heeft hem daar zelf ook nog wel wat bij geholpen. Dat liep uit op een geslaagd werkstuk plus een bezoekje van Christiaan, zoals bovenstaande foto laat zien.

    Zou je als informatiespecialist die technieken eigenlijk niet ook al moeten beheersen? In de praktijk misschien toch nog niet echt. Want wat Bellingcat doet, is een mengsel van meer technieken en competenties dan waar de informatieprofessional meestal mee te maken heeft gehad. Een mengsel van bronnenkennis, zoektechniek, verificatie- en analysetechnieken en een heleboel recherche-achtige slimheid. In de workshop van Christiaan op 28 maart komen fundamenten daarvan aan de orde. In twee uur natuurlijk niet zo veel als in de vijfdaagse cursus die Bellingcat daar in diverse landen zelf voor organiseert (met o.a. Henk van Ess en Christiaan als docenten).

    En wil je nu al testen of je die workshop van Christiaan nog nodig hebt, of dat je dit misschien toch al goed kunt? Er zijn allerlei online quizzen via Twitter waarin foto’s of video’s geanalyseerd moeten worden. Bellingcat heeft daar een mooi lijstje van: https://www.bellingcat.com/resources/2017/11/13/daily-verification-quizzes/
    Zo is er elke dag van de week wel eentje:

    • #MondayQuiz: Julia Bayer (Deutsche Welle)
    • #TuesdayQuiz: Lars Wienand (Funke)
    • #WednesdayQuiz: Tilman Wagner (Deutsche Welle)
    • #ThursdayQuiz: Christiaan Triebert (Bellingcat)
    • #FridayQuiz: Marco Bereth (ZDF), Philipp Dudek (FVW), Fiete Stegers (NDR).

    En als hulpmiddel hierbij kun je in elk geval gebruik maken van het overzicht van Bellingcat’s Digital Forensics Tools – A List of Open Source Verification and Investigation Tools and Methods.
    Maar het is natuurlijk veel leuker om van Christiaan zelf te leren hoe je een foto of video relateert aan een locatie op Google Maps (of een andere bron voor satellietbeelden) en hoe je bepaalt wanneer die opname gemaakt is. Je zult dan wel wat simpeler voorbeelden krijgen dan meteen het lokaliseren van een foto van een vrachtauto met een Buk-raket of een video van de liquidatie van IS-strijders door een militieleider in Libië.

    [Voor deze workshop is nog een aantal plaatsen beschikbaar, vooral in de ochtend]

    Speaker in the spotlight: David Graus

    Afgelopen zomer is David Graus gepromoveerd op een proefschrift “Entities of interest : Discovery in digital traces“. Zoals die (onder)titel al aangeeft, heeft hij daarin onderzoek gedaan naar de sporen die we voortdurend op internet achterlaten. Hij ontwikkelde daartoe rekenmethodes om die grote hoeveelheden gegevens (echte “big data”) te analyseren en te exploreren teneinde daar betekenis in te ontdekken. En een van de doelen daarvan is om uiteindelijk op basis van gegevens uit het verleden, iemands toekomstige activiteiten te kunnen voorspellen. Resultaten uit het verleden moeten zo dus wel garantie voor de toekomst gaan bieden.

    Onder de kop Deze promovendus weet alles over jouw online voetafdruk schreef het Amsterdamse universiteitsblad Folia over David’s promotie dat hij

    “zich met name bewust geworden [is] van de voordelen van het achterlaten van digitale sporen. ‘Mensen zien het als iets negatiefs, maar nemen de positieve dingen voor lief. Het is een transactie. Een site als Google zou veel minder goed werken als het ons gedrag niet zou monitoren.’ “

    Op dit soort onderwerpen – en de spanning die er natuurlijk wel is tussen dergelijke personalisatie en privacy – zal David ook ingaan in zijn lezing in het lezingentrack in de ochtend op 28 maart.

    Intussen werkt David bij de FD Mediagroep, het bedrijf achter onder meer Het Financieele Dagblad en BNR Nieuwsradio. Ook daar werkt hij aan dit soort onderwerpen, zoals blijkt uit zijn recente artikel op de Company.info-blog over “Machine learning en voorspellende inzichten uit bedrijfsinformatie“.
    Vorige week meldde David ook dat een artikel dat hij nog bij de UVA, samen met Daan Odijk en Maarten de Rijke geschreven had, eindelijk in JASIST gepubliceerd was: The birth of collective memories: Analyzing emerging entities in text streams.
    En dat is in Open Access! 😉

    En hoe doet de politie dat nou?

    Een bericht van Arno Reuser:
    Begin februari is een 18-jarige jongen opgepakt voor een DDoS aanval op de website van de belastingdienst. Hoe kom je er nu achter wie dat heeft gedaan? Hoe doen echte politiemensen echt onderzoek in sociale media, real-time, om boeven te vangen en strafbare feiten te vinden? Twee echte politiemensen die gepokt en gemazeld zijn in diepgravend onderzoek in onder andere sociale media komen in hun lezing vertellen en in hun workshop laten zien, hoe ze dat doen; de methoden en de technieken.
    Uw kans voor een kijkje in de achterkamers van de nationale politie. Met echte politiemensen, uit de praktijk.

    NB: De workshop van Rein Tellier & Elwin de Man is intussen al bijna volgeboekt.

    AI vs. Automation Workshop by Joseph Busch

    AI vs. Automation: Automated Tagging and Machine Learning Workshop
    Voor belangstellenden hier vast de agenda van de workshop van Joseph Busch. [Propaganda voor zijn keynote stond al in onze vorige post]


    Time Format Description Outcomes

    30 min

    Lecture

  • What is artificial intelligence, automated tagging, and machine learning.
  • Understand the key features and differences of AI, automated tagging, and machine learning.
  • 30 min

    Demo

  • Demo some natural language processing, entity extraction, and complex Boolean query tagging tools:
    – Lexalytics Semantria. [1]
    – Data Harmony Machine Aided Indexer (MAI) [2]
  • Understand the types of features that differentiate automated tagging tools, and the criteria for evaluating them.
  • 30 min

    Activity

  • Participate in a query building exercise working hands-on with tagging tools:
    – Lexalytics Semantria for Excel.
    – Data Harmony Machine Aided Indexer (MAI)
  • Obtain a practical understanding of how to build an automated classifier.
  • 30 min

    Lecture & demo

  • Review the pitfalls and benefits of machine learning in practice.
  • Demo Unsilo [3], an unsupervised machine learning tool.
  • Understand the differences between supervised and unsupervised machine learning.
  • Be aware of potential unintended consequences of unsupervised machine learning.
  • .

    Dit zijn ze dan

    Dit zijn de negen sprekers die 28 maart in acht lezingen aan het woord komen; met linksboven en rechtsonder onze keynote sprekers. In elk geval om te zien is het al een afwisselend gezelschap. Wie preciezer wil weten waar ze het over gaan hebben (en wie ze zijn), moet de teksten op onze lezingenpagina maar eens zorgvuldig doornemen.
    Als je bij hun lezingen wilt zijn, moet je je natuurlijk tijdig aanmelden voor deze dag (als je dat niet al gedaan hebt). En daarbij heb je dan nog de moeilijke keuze of je bij een lezingentrack wilt zijn of bij een van de minstens even interessante workshops die je ook nog kunt volgen. Kijk maar naar het programma.
    Een ware “embarras du choix” oftewel keuzestress.