Alle columns

Niet al zijn columns gingen over zoeken, maar Google en zoekmachines werden wel heel vaak genoemd. Ook op deze “zoeken & vinden”-blog willen we daarom graag melden dat alle 102 columns die Eric Sieverts in de jaren 1997-2015 voor vakblad Informatie Professional schreef, nu in één document zijn verzameld. De woordenwolk hierboven die ter gelegenheid van de 100ste column was gemaakt, geeft maar een bescheiden indruk van de gevarieerde onderwerpen die in die lange periode aan de orde kwamen. (Her)lezen dus …

Blijven we nog Googlen?

Gepubliceerd in InformatieProfessional september 2018, onder

TOEKOMST VAN HET ZOEKEN | Eric Sieverts


© Informatie Professional (Uitgeverij IP, Voorburg)

Is Google nog wel een zoekmachine? Er zijn heel wat signalen die maken dat je dat in twijfel kunt trekken.

Van die signalen zijn tal van voorbeelden te geven. Zo viel in de keynote op Google’s ontwikkelaarscongres Google-I/O in mei, met aankondigingen van wel honderd nieuwigheden, slechts tweemaal het woord ‘search.
Maar er is meer.

Verdwijnende functionaliteit

Dat de afgelopen jaren allerlei zoekfunctionaliteit is verdwenen, is al herhaaldelijk door allerlei zoekprofessionals als Phil Bradley, Karen Blakeman of Danny Sullivan gememoreerd. En daaraan lijkt nog geen eind gekomen met recente veranderingen in image search en het afschaffen van het “info:” commando. Soms lijkt het overigens te helpen als je je daar kwaad over maakt. Afgelopen najaar waren er geruchten dat ook twee favoriete tools van dé Nederlandse internet zoekexpert Henk van Ess zouden verdwijnen. De * woord-wildcard en de AROUND(n) afstandsoperator waarmee je naar bepaalde patronen in tekst kunt zoeken. Maar dankzij extra ophef die Henk hierover georganiseerd had, kon hij vlak voor kerst op Twitter melden:

PageRank

Het octrooi op Google’s pagerank, de functionaliteit waaraan Google zijn bijna-monopolie op websearch te danken heeft, is vorig jaar verlopen. De 20 jaar dat een vinding beschermd wordt, waren om. Niet dat Google overigens geld verdiende aan het uitbaten van dat octrooi, want dat stond nog altijd op naam van Stanford University, waar Larry Page en Sergey Brin studeerden toen ze hun nieuwe methode van ranking bedachten. Bovendien lijkt pagerank een steeds minder belangrijke rol te spelen bij het presenteren van zoekresultaten. Een eerste stap in die richting was de personalisatie van de ranking die al jaren geleden zijn intrede deed. Kennis over wat een gebruiker eerder gezocht en bekeken had, begon een net zo belangrijke rol te spelen als de op backlinks gebaseerde pagerank.

Semantiek en intentie

Nog een stapje verder gaan de pogingen van Google om vragen concreet te beantwoorden. In het semantische tijdperk gaat het er niet langer om welke letters een zoeker intikt, maar om de betekenis daarvan. En belangrijker nog, om de intentie van de zoeker. Wat wil die eigenlijk weten? Hoe kan daarop direct antwoord gegeven worden, liefst zonder een lijst met tien blauwe links naar webpagina’s. Daarvoor moeten zoekvragen geïnterpreteerd en begrepen worden, zelfs als die maar uit een enkel woord bestaan. Er wordt hoog opgegeven van de zelflerende algoritmes – deep learning – die hiervoor in de module RankBrain zitten. Maar in de praktijk blijken op veel simpeler niveau de locatie van de gebruiker en het gebruikte apparaat nog de belangrijkste rol te spelen. Zo kreeg ik onlangs in Italië, hoewel persoonlijk bij Google ingelogd, vooral Italiaanse zoekresultaten op mijn niet-Italiaanse zoekvragen. Locatiegegevens bleken veel belangrijker bij het vaststellen van mijn intentie dan wat Google al van me wist. Want thuis bekijk ik vrijwel nooit Italiaanse webpagina’s. Google blijkt zich er overigens van bewust te zijn niet altijd zeker te kunnen weten wat een gebruiker precies bedoelt, zelfs als diens zoekvraag keurig uit een zinnetje bestaat. Om welk aspect of welke invalshoek gaat het? Wil je een oorzaak of een remedie? Om die problematiek op te lossen, geeft Google nu soms twee antwoorden, waaruit de gebruiker kan kiezen. Deze antwoordblokjes worden wel multifaceted featured snippets genoemd. Overigens bestond dat eerder ook al bij zoekmachine Bing.

Antwoordmachine

Van recht-toe-recht-aan zoekmachine is Google dus geëvolueerd tot antwoordmachine. Het is duidelijk dat niet elke informatiespecialist op die ontwikkeling zit te wachten. Een andere beroepsgroep heeft daar om andere redenen trouwens ook problemen mee. In de wereld van de zoekmachineoptimalisatie (SEO) zijn oude voorschriften hoe je webpagina’s hoog laat scoren niet meer zo relevant, als bovenaan de resultatenpagina van een zoekmachine vaak geen webpagina’s maar antwoorden komen te staan. Vandaar ook speciale aanwijzingen hoe je pagina’s moet optimaliseren voor Google’s RankBrain machine learning techniek. Ook nuttig in dat verband is “Five Years of Google Ranking Signals”, een recent uitputtend overzicht door Bill Slawski.

Verdwijnende zoekgoeroes

In het verleden waren er nogal wat zoekgoeroes die Google kritisch volgden, op Twitter en in hun eigen weblogs. Maar veel daarvan zijn intussen verdwenen of doen er meestentijds het zwijgen toe. Gwen Harris (@websearchlady) is met pensioen, van de immer kritische Phil Bradley horen we nog nauwelijks iets [*], Greg Notess en Marydee Ojala schrijven hooguit nog wat in betaalde bladen en van Danny Sullivan komen niet heel veel kritische geluiden meer nu hij, na zijn afscheid bij SearchEngineLand, bij Google zelf in dienst gekomen is. Nu pakt dat laatste soms wel goed uit, want het lijkt dat de eerder genoemde actie van Henk van Ess vooral dankzij hem succes gehad heeft. Op Twitter komen eigenlijk alleen van Karen Blakeman nog serieuze kritische berichten over zoeken met Google. En helaas betreft dat meestal verslechterde primaire zoekfunctionaliteit .

Nieuwe prioriteiten

Tot zover klinkt dit verhaal niet bijster positief. Ik heb het dan ook alleen over de basis van het zoeken gehad en niet over de honderd nieuwtjes die in mei op Google I/O wel aan de orde gekomen waren . Maar die hebben ook maar betrekkelijk weinig met de core business van het zoeken te maken. Die gingen vooral om Google Assistant die je spraakgestuurd in steeds meer talen steeds meer dingen voor je kunt laten doen, nu ook in het Nederlands. Die betroffen AI en machine learning voor heel andere toepassingen dan search. Dat was dat Android beter geschikt wordt voor toepassing in TV, auto’s en Google Assistant. Dat waren nieuwigheden in Google Maps, Photos en News, en ontwikkelingen voor Virtual Reality. En tel zo nog maar even door tot 100.

Overigens zijn er stemmen die denken dat Google zelf wel eens zou kunnen instorten, omdat het op de advertentiemarkt waar het zijn geld verdient, wordt verdrongen door Amazon en Facebook. Dat brengt me dan terug bij mijn beginvraag: ik denk dat we toch nog wel een tijdje zullen blijven Googlen, ook al is de officiële naam van het moederbedrijf tegenwoordig Alfabet. En ook al staat dat werkwoord dan niet meer voor het gestructureerde en gecontroleerde zoeken dat informatieprofessionals prefereren. Of je dat erg moet vinden, laat ik aan de lezer over.


[*] Sinds het verschijnen van dit artikel heeft ook Phil Bradley gemeld dat hij met pensioen gaat en ophoudt met zijn blog en zijn tweets.

.

Herbert van de Sompel Chief Innovation Officer bij DANS

Groot nieuws. Herbert van de Sompel, keynote spreker op VOGIN-IP-2017, komt in Nederland werken, bij DANS, het Nederlands instituut voor permanente toegang tot digitale onderzoeksgegevens. Na 16 jaar verbonden te zijn geweest aan het Los Alamos National Laboratory in New Mexico (VS), komt hij nu dus terug naar Europa. Hieronder nemen we een stuk van het nieuwsbericht op de DANS-site over:

…. Sinds 2002 is hij leider van het onderzoeksteam ‘Digital Library Research and Prototyping’ aan het Los Alamos National Laboratory (New Mexico, USA). Hij ligt mede aan de grondslag van veel gebruikte informatie standaarden (onder meer OAI-PMH, OpenURL, OAI-ORE, Memento, NISO/OAI ResourceSync, Web Annotation) en nam deel aan invloedrijk onderzoek naar onder meer alternatieve metrieken voor wetenschappelijke publicaties (MESUR project) en ‘reference rot’ in wetenschappelijke communicatie (Hiberlink project). In 2017 ontving hij de prestigieuze Paul Evan Peters Award voor zijn bijdrages aan duurzame digitale infrastructuur ter ondersteuning van onderwijs en onderzoek.

Van de Sompel was al tweemaal visiting professor bij DANS. DANS-medewerkers beschrijven hem als iemand die het potentieel heeft om dingen die in de internet- en archiefgemeenschap als wenselijk worden gezien ook te laten gebeuren, en dan vaak ook nog op een hele grote schaal.

Van de Sompel: “Mijn recente sabbatical bij DANS is me danig bevallen, dat ik de mogelijkheid om er vast aan de slag te gaan gretig heb aangenomen. Ik kijk er echt naar uit om bij te dragen aan de vele nationale en internationale projecten waarbij DANS is betrokken. Ik hoop ook een aantal van mijn recente initiatieven vanuit DANS verder uit te kunnen bouwen, denk bijvoorbeeld aan Memento Tracer, een innovatieve aanpak voor webarchiveren.”

Nu wordt het nog makkelijker Herbert nog weer een keer als spreker bij VOGIN-IP uit te nodigen.

Ook weer in 2019

Al ligt de vorige VOGIN-IP-lezing nog vers in ons geheugen, we zijn toch al weer bezig voor 2019.

De datum voor het komende evenement ligt nog niet definitief vast. Maar het zal in elk geval weer in de OBA zijn, op 14 of 21 maart. Zodra de definitieve keuze gemaakt is, laten we dat hier weten. Intussen verzamelen we vast namen van potentiële sprekers en onderwerpen voor workshops. Ook daarover houden we u op de hoogte.

Daar zijn de filmclips

We kondigden de filmpjes al eerder aan – en wie 28 maart aanwezig was, had de filmcrew natuurlijk ook voortdurend rond zien lopen. Maar hier zijn de filmclips dan.

Hierboven één wat langere introductie op de hele dag (23 minuten) en verder kortere clips over diverse thema’s die [hier] op één pagina verzameld zijn. Je kunt ze hieronder ook individueel aanklikken:

Wat u ervan vond …

Veel deelnemers – ruim 100 – hebben gelukkig de moeite genomen het evaluatieformulier voor de VOGIN-IP-dag in te vullen. Als dank daarvoor vindt u hierbij wat algemene resultaten van die evaluatie. En daar zijn we best trots op, want u was gelukkig aardig tevreden.
Dat gold zowel voor de organisatie van de dag – die door 96% van de respondenten goed of zelfs uitstekend werd genoemd – als voor de prijs/kwaliteit-verhouding.
Daarnaast is de verzorging van de inwendige mens natuurlijk ook altijd van belang:
Inhoudelijk gezien bleek “iedereen” te vinden dat we voldoende keuze aan workshops geboden hadden (al waren er nog wel enkele suggesties voor volgend jaar).Maar ja, al die workshops en ook nog lezingentracks leidden dan wel weer tot keuzestress bij 70% van de respondenten.
Ondanks het volle programma bleken de wandelgangen toch ook nog genoeg mogelijkheden te bieden voor professionele en sociale contacten.
Was er dan helemaal niets aan te merken? De door ons geprogrammeerde (maar inhoudelijk buiten onze verantwoordelijkheid vallende) sponsorpitches werden door een meerderheid van de deelnemers niet erg nuttig gevonden.
En tot slot: wat vond u nu eigenlijk van de lezingen en workshops?
Voor de lezingen liggen de gemiddelden van de gegeven rapportcijfers tussen 7,0 en 8,5. Geen onvoldoendes dus en zelfs geen “zesjes”. En het gemiddelde ervan lag 0,2 punt hoger dan vorig jaar.
Voor de workshops was er helaas wel een onvoldoende, een 5, maar de negen overige workshops scoorden tussen 6,9 en 8,4. En dat maakte dat, ondanks die ene onvoldoende, het gemiddelde toch nog 0,05 punt hoger lag dan vorig jaar ….

Woensdag was het zover ….

Hoewel van de verwachte 275 bezoekers (inclusief sprekers en organisatie) er jammer genoeg een paar ziek thuis hadden moeten blijven, was het afgelopen woensdag toch buitengemeen druk in de OBA. Overigens waren niet alleen een paar deelnemers door griep geveld, ook één van de sprekers, Laura Hollink, had last minute een collega moeten afvaardigen voor het geven van haar lezing (die gelukkig ook al een beetje zijn lezing was). En Arno Reuser had nog wel zijn workshop tot een goed einde weten te brengen, maar het dinertje daarna had hij niet meer gehaald.
Al die mensen die er wel waren, hebben zich naar onze indruk goed vermaakt met de niet altijd simpele lezingen en workshops. Een terugblik daarop zal de komende weken stukje bij beetje op deze site verschijnen. Een groot deel van de presentaties is er nu zelfs al. En ook de twitterstream van 28 maart. [En sinds 3 april ook een grote collectie foto’s.]

Hier vast een blik op de openingskeynote door Joseph Busch, ….
… waarna in een van de volgende lezingen David Graus ontkrachtte dat zoiets als een filterbubbel bestaat.
In de afsluitende keynote werd zelfs de leek duidelijk gemaakt hoe blockchain (ongeveer) werkt en waarom die techniek lang niet voor alles nuttig is. Maar eigenlijk was Ruben Verborgh’s boodschap dat we op het web naar meer gedecentraliseerde diensten toe moeten.

Voor wie live stukjes terug wil zien zijn ook filmopnamen gemaakt, waarvoor onder meer Christiaan Triebert geïnterviewd werd. De filmers zijn nu eerst nog even druk bezig met de montage van de beelden die ze geschoten hebben. Maar als dat klaar is, zal dat hier ook terug te zien zijn.

En tot slot dan nog dit:  
alle deelnemers zullen in de loop van komende week een link naar ons evaluatieformulier toegestuurd krijgen. Want we willen altijd graag weten wat u ervan vond en wat wellicht voor verbetering vatbaar is. Op die manier hopen we ervoor te zorgen dat volgend jaar iedereen er ook weer bij wil zijn.

Woensdag is het zover ….

Voordat de deelnemers aan de VOGIN-IP-lezing woensdag 28 maart – in alle vroegte – naar de OBA afreizen, hebben we voor hen nog een paar punten.

  • Velen van jullie zullen de OBA, de Openbare Bibliotheek Amsterdam wel kennen. Zo niet: het is op het Oosterdokseiland, 5 à 10 minuten lopen oost van het Centraal Station. Bekijk die plek zonodig op Google Maps. Je komt op de juiste plaats terecht via https://tinyurl.com/OBA-voginip
  • De bijeenkomst begint al vroeg. Zorg dus tijdig voor de eerste lezing aanwezig te zijn. Die begint om 9.30 uur. Hoewel de bibliotheek zelf pas om 10 uur opengaat, mag je voor ons congres al vanaf 9 uur naar binnen. Na de recente verbouwing is het het handigst om met lift of roltrap naar de 6de etage te gaan en daar de nieuwe trap naar het theater te nemen. Vanwege het grote aantal deelnemers splitsen we halverwege die trap de deelnemers dan al op alfabet. Bovenaan die trap kun je je badge en verdere paperassen ophalen en vast een kopje koffie nemen.
  • Op je badge staat ook voor welke lezingentrack(s) en/of workshop(s) je ingeschreven hebt. Omdat de meeste workshops zijn volgeboekt, is het niet mogelijk hiervan af te wijken. Het definitieve programma vind je op https://vogin-ip-lezing.net/programma-2018/. Daarin ook links naar plattegrondjes waar de workshoplocaties zich bevinden. Bij inschrijving ontvang je die trouwens ook nog in gedrukte vorm.
  • Er is Wifi bij de OBA. We raden je dus sterk aan om een laptop of tablet mee te nemen. Voor het meedoen aan de workshops is dat eigenlijk onontbeerlijk. En verder kun je natuurlijk je aantekeningen rechtstreeks in de cloud maken en via sociale media ervaringen uitwisselen met andere deelnemers en thuisblijvers op de hoogte houden.
    Er is al een hashtag #voginip afgesproken. Lekker kort, zonder jaartal, omdat het vanzelfsprekend is dat het nu om de aflevering van dit jaar gaat. En als je je nu al aanmeldt bij Twubs, dan kun je straks gemakkelijk aan alle Twitterdiscussies deelnemen: http://twubs.com/voginip
  • In de pauzes kun je in de foyer op de 7de etage bij de stands (=tafels) van onze sponsoren terecht.
  • Na afloop van het programma bieden we je nog een borrel met hapjes aan, om wat na te praten (en te netwerken). Loop na de laatste spreker dus niet meteen weg. En laat het thuisfront ook weten dat het iets later kan worden, want we mogen tot 7 uur blijven.