BlockChain in de OBA

Een klein tipje van de sluier rond de komende VOGIN-IP-lezing kunnen we al oplichten. We gaan het 28 maart niet hebben over bitcoins of andere cryptocurrency. Maar de achterliggende techniek van BlockChain is wel dermate interessant dat we willen kijken wat die kan betekenen voor toepassingen op ons gebied. We kunnen nu al verklappen dat er zowel een lezing als een workshop zal zijn die daar aandacht aan besteedt.

Meeste materiaal is binnen

Voor wie het nog niet gezien (of bekeken) heeft: het merendeel van het materiaal – powerpoints e.d. – van de lezingen en workshops op 9 maart staat intussen op onze site.
– Van Agnes Molnar is er een video, waarin zij de demonstratie van Microsoft Tools laat zien die tijdens haar lezing door technische problemen niet lukte.
– Van Henk van Ess is er een uitgebreide powerpoint van zijn workshop “Zoekupdate 2017”.
– Van Christiaan Triebert is er – behalve zijn powerpoint – ook een lijstje met de geolocatie-tools die hij in zijn lezing genoemd had.
– Van ….
…….. enfin kijkt u zelf maar wat er verder nog van uw gading is.

Sprekers in de Spotlights

Henk van Ess en Christiaan Triebert samen in het nieuws

Missile Launcher

This missile launcher was dumped in Cairo. Or was it? And when was it?

Op een heleboel websites kom je bovenstaande foto intussen tegen. Omdat het nieuws was dat vlakbij de luchthaven van Caïro deze losliggende raketwerper in een wegberm gevonden zou zijn. Maar nu ook omdat Henk van Ess deze week samen met een groep cursisten heeft uitgezocht hoe het precies zat met die raketwerper, met die foto en vooral met een al dan niet geantedateerd en al dan niet weer gewist filmpje dat de vinder ter plekke gemaakt zou hebben. Over de resultaten van dat onderzoek heeft Henk vervolgens uitgebreid gerapporteerd in zijn rubriek op Medium. En dat is weer op blogs en nieuwsdiensten op allerlei plekken op de wereld opgepikt.
Interessant is bovendien dat hij hiervoor nauw heeft samengewerkt met een andere #voginip-spreker, Bellingcat-lid Christiaan Triebert. Die wordt door Henk, klaarblijkelijk niet ten onrechte, aangeprezen als “the fastest geolocation tracker in the world“. Christiaan heeft namelijk uitgezocht waar en wanneer dat filmpje precies gemaakt is, door een uit die video gegenereerde panoramafoto te vergelijken met allerlei satellietbeelden (meer dan alleen op Google Maps). Onder andere ook door daarop de bouwactiviteiten van de gebouwen op de achtergrond in de tijd te volgen.

cairo
Mooiere reclame voor twee van onze sprekers kunnen we ons haast niet wensen. Niet dat we verwachten dat de lezers van het American Press Institute, van Sasapost, of van Middle East Eye op 9 maart ook meteen in groten getale naar de OBA zullen komen. Maar voor al die mensen die zich intussen voor deze dag hebben aangemeld – en dat zijn er al ongekend veel – is het natuurlijk leuk om daar uit de eerste hand wat meer te horen over de door Henk en Christiaan gebruikte onderzoekstechnieken.

@henkvaness: LAST UPDATE: Sunday Feb 26, 2017, added 5 new clues

Nog een update: Henk van Ess vertelt op 17 maart bij “Bureau Buitenland” van de VPRO op NPO-1 over deze zaak

PS: Er zijn overigens nog maar ongeveer 20 plaatsen te vergeven ….
.

Speaker Spotlight

Beelden vinden zonder 1000 woorden
cees snoekAutomatisch herkennen wat op een foto of video is afgebeeld, zonder daar begeleidende tekst voor nodig te hebben, was lang een heilige graal voor onderzoek aan information retrieval. En zoals een graal betaamt, lag die ver weg aan de horizon. Maar die situatie is intussen sterk veranderd.
Google zegt zinnetjes te kunnen genereren die beschrijven wat op een foto te zien is.
Flickr voegt al enige tijd zelf tags toe aan geüploade foto’s.
Semantische zoekmachine Wolfram-Alpha heeft een testsysteem dat herkent wat het hoofdonderwerp van geüploade foto’s is.
Facebook heeft recent aangekondigd te kunnen herkennen wat op de miljarden foto’s staat, die we daar gezamenlijk hebben neergezet. (Zie o.a. HIER en HIER).
En onlangs waren er berichten dat Samsung in een nieuwe digitale assistent (Bixby) automatische herkenning van je eigen mobiel gemaakte foto’s inbouwt, zodat je die zelf makkelijker kunt terugvinden.
Zo zou ik nog wel even kunnen doorgaan. Deze hausse lijkt helemaal veroorzaakt door de snelle opmars van kunstmatige intelligentie, en met name van technieken voor machine learning, zoals diepe neurale netwerken – vandaar de ook wel gebruikte aanduiding “deep learning”.
De hier gegeven voorbeelden wekken wellicht de indruk dat het allemaal van de grote spelers in de VS moet komen. Maar dat is niet terecht. In Nederland speelt Cees Snoek al ruim 10 jaar een vooraanstaande rol op dit gebied. Ook toen dat nog geen hype-woord was, paste hij al methoden van machine learning toe en wonnen in zijn onderzoeksgroep ontwikkelde algoritmes prijzen op internationale toernooien voor beeldherkenning en beeldzoeken. Intussen geeft hij leiding aan het onderzoek bij QUVA Lab, een samenwerking tussen de UVA en de Amerikaanse chip-bouwer Qualcomm die beeldherkenning in mobieltjes wil inbouwen. Weinigen zullen dus beter in staat zijn om ons van de nieuwste ontwikkelingen op de hoogte te brengen en trend van hype te scheiden. De lezing van Cees zit op 9 maart in het middagprogramma.
image recognition

Speaker Spotlight

Hoe zoekt Bellingcat?
triebertVoor het burger-onderzoekscollectief Bellingcat vormt “informatie” de belangrijkste grondstof voor hun speurwerk. Toch bestaat het collectief niet primair uit informatiespecialisten, maar de leden zijn dat langzamerhand natuurlijk wel geworden. Dat was een goede reden om een Nederlandse deelnemer aan het collectief, Christiaan Triebert (@trbrtc), als spreker op de VOGIN-IP-lezing uit te nodigen. Dat Christiaan zich niet tot alleen desk-research beperkt, blijkt wel uit bijgaande foto.
In december heeft hij in het Koerdische deel van Irak lokale journalisten geschoold in het soort onderzoek met behulp van “open bronnen”, dat het handelsmerk van Bellingcat geworden is. Veilig in Amsterdam, zal hij 9 maart de bezoekers van de VOGIN-IP-lezing ook over die methoden vertellen. Vooraf stelde IP al wat vragen aan Christiaan. Lees hier vast de antwoorden die hij gaf. In het komende februarinummer van IP verschijnen die antwoorden ook in print.

Business information according to Karen

karen-bw
Waar moet je zijn voor zakelijke informatie? Kun je die ook al allemaal gratis op het web vinden, of moet je daarvoor beslist bij dure betaalde bronnen wezen?
Ook dat is weer zo’n vraag waar geen eenvoudig JA/NEE antwoord voor bestaat. Want dat hangt er natuurlijk helemaal vanaf wat voor soort informatie je voor welk doel zoekt. Gelukkig is er iemand die zich al jarenlang hierin heeft gespecialiseerd: Karen Blakeman. En zij is bereid de deelnemers aan de VOGIN-IP-lezing daar “alles” over te vertellen. Zowel in een algemene lezing, als in een workshop waar de deelnemers haar tips & tricks meteen in de praktijk kunnen brengen.
Hieronder vast een recente presentatie van Karen over dit onderwerp. Voor belangstellenden bedoeld als opwarmertje om 9 maart te komen luisteren of te komen meedoen. En zeker niet bedoeld als substituut daarvoor, want er gaat nu eenmaal niets boven “the real thing” met mogelijkheid tot directe interactie met de expert zelf.

.
Dat Karen ook over algemene zoekzaken op internet genoeg te vertellen heeft blijkt uit de twee presentaties die ze afgelopen najaar weer gegeven heeft bij de “Web Search Academy”op Internet Librarian International in Londen. Ter informatie hieronder linkjes naar die presentaties. Wellicht kun je haar dan op 9 maart ook daarover nog aan de tand voelen.

slideskaren1     slideskaren2

Linkrot, linkroest en webarchieven

Unionhall Harbour (Co, Ireland)

9 maart klokslag half tien zal de VOGIN-IP-lezing zinderend van start gaan met de keynote van Herbert van de Sompel: “En toen was er niets meer”.
Herbert is een Gentenaar die nu al vele jaren in New Mexico werkt, bij het Los Alamos National Laboratory, een van de grootste onderzoekscentra in de VS. Hij heeft aan de wieg gestaan van een hele reeks van innovaties op ons terrein, zoals OpenURL link resolving (in SFX), de OAI-PMH en ORE-PMH protocollen, om metadata uit repositories te ‘harvesten’, en het Memento-protocol, om van intussen verdwenen of gewijzigde webpagina’s zo ongemerkt en automatisch mogelijk gearchiveerde oude versies te lokaliseren en op te vragen.
Dat laatste protocol poogt een probleem op te lossen dat Herbert de laatste jaren na aan het hart ligt: het feit dat zoveel links op internet, zelfs in en naar wetenschappelijke publicaties, vaak na korte tijd al niet meer correct werken. Óf de link werkt helemaal niet meer (link-rot), óf je komt op heel andere inhoud terecht, die intussen op dat oorspronkelijke webadres verschenen is (content-drift). Naar die twee vormen van reference-rot heeft hij, samen met collega’s, uitgebreid kwantitatief onderzoek gedaan. In [dit artikel] dat in december in PLOS|one is verschenen, rapporteren zij de uitkomsten van hun onderzoek. Hun conclusie is dat ruim 80% (!) van de 1.059.742 referenties die ze in hun onderzoek betrokken hadden, te lijden had van enige vorm van reference rot.
INTERVIEW MET HERBERT VAN DE SOMPELDe voorgestelde Memento-oplossing werkt helaas alleen als webpagina’s ergens gearchiveerd zijn – en ook afzonderlijk de achtereenvolgende versies daarvan, als het pagina’s zijn die aan verandering onderhevig zijn. Dat “archiveren” kwam dan ook met uitroeptekens terug in het interview dat IP-redacteur Frank Huysmans begin 2016 met Herbert van de Sompel had. Dat interview uit IP 2016|03 is hier [PDF] nog een keer na te lezen.

Meer informatie over Herbert’s keynote lezing is [HIER] te vinden.

Dit bericht is FAKE (of toch niet?)

fake   stopfake
Hoe weet je of dit bericht geen fake is? En of die hele VOGIN-IP-lezing wellicht een hoax is? Waarschijnlijk omdat je ons vertrouwt. En waarschijnlijk omdat je digitaal geletterd bent. En belangrijker nog: die geletterdheid is waarschijnlijk ook niet alleen digitaal.
Maar kennelijk is dat niet voor iedereen zo makkelijk, als we de recente discussies over fake-nieuws volgen, die rond de Amerikaanse presidentsverkiezingen in een geweldige stroomversnelling zijn geraakt.fakebookDe hoaxes en fake berichten die op Facebook (Fakebook?) gedeeld werden of in Google een hoge ranking kregen, hebben misschien wel bijgedragen aan de uiteindelijke verkiezingsuitslag. dislikeHet maken van dergelijke fake-berichten blijkt zelfs een heuse industrietak te zijn geworden.
Het zou daarom mooi zijn als betrouwbare informatie een stempeltje ”niet fake” zou kunnen krijgen. Zelfs Facebook en Google willen dat intussen wel. Maar het is een beetje te veel om dat allemaal door mensen te laten doen. Nu iedereen het over machine learning heeft, kunnen we een computer misschien wel leren dat voor ons te doen. Dat is nu precies waarmee Srijan Kumar bezig geweest is. Hij heeft onderzocht waaraan hoaxes die in de Wikipedia terecht gekomen zijn, herkend kunnen worden. Dat is nog niet het hele internet en heel wat minder dan alle nieuwtjes op Facebook, maar het is wel al een aardige stap in een mogelijke richting om automatisch onzin te laten herkennen.
We zijn dan ook blij dat Srijan ons op 9 maart daar het een en ander over komt vertellen in zijn lezing: “Disinformation on the Web: Impact, Characteristics, and Detection of Wikipedia Hoaxes”.
[Zie ook deze PDF.]
flatwiki

 

7-year-old Aleppo girl fact check

bana-washington postGisteren rapporteerde de Washington Post over de onzekerheid of het 7-jarige meisje Bana uit Aleppo dat over de situatie daar twitterde, wel werkelijk in Oost-Aleppo zat. Of dat hele twitter-account van Bana wellicht een hoax was. Een politiek beladen onderwerp, omdat sommige groepen er belang bij hadden het te doen voorkomen dat dit niet echt kon zijn. De Washington Post kwam tot de conclusie dat het wel echt was. Daarvoor baseerden ze zich vooral op het onderzoek dat het Bellingcat collectief naar deze zaak gedaan had.
bana-bellingcatTot die positieve conclusie was Bellingcat vooral gekomen op basis van zorgvuldige analyse van beeldmateriaal – foto’s die bij de tweets zaten en video’s op Periscope. En vooral ook door mapping van die beelden met Google Maps.
banaEn die geolocation techniek is ook precies een van de dingen waar Christiaan Triebert, een Nederlands lid van dat Bellingcat collectief, ons op 9 maart over komt vertellen. Hij laat dan wat meer zien van de diverse methoden die Bellingcat toepast, met gebruikmaking van open bronnen en vrij beschikbare tools. [Zie de outline van zijn lezing].