Extra terugblik op VOGIN-IP-2021

Op de valreep nog een stukje over VOGIN-IP-2021. Last minute kunnen we de bezoekers van onze site nog de door Marjo Bakker en Cindy Lammers geschreven terugblik op VOGIN-IP-2021 uit het decembernummer van IP aanbieden – ook voor wie geen abonnee van het blad is.

Dat is dan meteen een opwarmertje voor de nieuwe koers van IP. Met ingang van 2022 gaat het vakblad “hybride”. Van de gebruikelijke negen nummers zullen abonnees er vier nog gewoon (ouderwets?) in de brievenbus ontvangen; de overige vijf krijgen ze online. Lees hier de aankondiging.

Spraakherkenning anno 1999

In de Belgische krant De Standaard stond 10 december een bericht dat oude herinneringen opriep.



Lernout & Hauspie was destijds een veelbelovend taaltechnologiebedrijf in Ieper in “Flanders Language Valley“. Eind jaren ’90 van de vorige eeuw gooiden zij hoge ogen met onder meer – toen al – spraakherkenningssoftware en automatische tekstvertaling. Vandaar dat in 1999, op de allereerste IP-lezing, de verre voorganger van onze huidige VOGIN-IP-lezingen, ook een presentatie over hun product geprogrammeerd was. In het verslag van die congresdag in IP (nov. 1999) stond onderstaand fragment over dat verhaal van Lernout & Hauspie.



Hoewel ze mooie producten ontwikkelden – ook Microsoft had een licentie genomen op een deel van hun technologie – bleken er ernstige zakelijke malversaties te hebben plaatsgevonden. Zo waren fictieve transacties in Zuid-Korea in de boeken opgenomen. Gevolg was dat het bedrijf twee jaar na die mooie IP-lezing failliet ging. Veel kleine lokale Vlaamse investeerders zijn daarbij hun geld kwijtgeraakt. Twintig jaar later meldt De Standaard nu dat het Gentse Hof van Beroep uiteindelijk uitspraak heeft gedaan dat €650 miljoen schadevergoeding uitbetaald moet worden aan ruim 4000 gedupeerden.
In de twintig jaar die sinds dat faillissement zijn verlopen, heeft taaltechnologie een stormachtige verdere ontwikkeling doorgemaakt. In de afgelopen VOGIN-IP-lezing gaf Antal van den Bosch daar in zijn keynote (video) nog een mooi overzicht van. In de overvloed aan spraak- en vertaalproducten die dit heeft opgeleverd, denk ik niet dat nog erg veel van die oorspronkelijke Vlaamse technologie van L&H terug te vinden is.


PS: In België blijkt the story of L&H nog altijd levend te zijn: The Legend of Lernout & Hauspie (tweet)

Lezersonderzoek IP


Nog even een kleine wederdienst aan onze partner Vakblad IP.
De redactie wil namelijk graag weten wat ze goed doen in de papieren IP en wat wellicht beter kan. Daarom vragen ze IP-lezers 5 minuten van hun tijd, met het verzoek om mee te doen aan hun lezersonderzoek. Dat verzoek nemen we op deze plaats graag over. Klik HIER voor de enquête.

Februari

IP gasthoofdredacteur Maxim Februari ontvangt de P.C. Hooft-prijs.


Op de omslag van het decembernummer van ons vakblad IP en in het digitale IP-nieuws stond trots vermeld dat essayist / NRC-columnist / jurist / filosoof / …   Maxim Februari als gasthoofdredacteur voor dat nummer was opgetreden. Nog maar luttele dagen later explodeerde die trots zelfs, toen NRC en alle andere media meldden dat aan Maxim Februari de P.C. Hooft-prijs voor beschouwend proza was toegekend. Een wel heel gelukkige samenloop van gebeurtenissen.
Er was voor onze partner IP dus alle reden om welgemeende gelukwensen naar de laureaat te doen uitgaan. Als VOGIN-IP-team sluiten we ons daar van harte bij aan.
Wie geïnteresseerd is (en nog geen abonnee), kan hier een proefnummer van dit onvolprezen vakblad aanvragen.

Alle columns

Niet al zijn columns gingen over zoeken, maar Google en zoekmachines werden wel heel vaak genoemd. Ook op deze “zoeken & vinden”-blog willen we daarom graag melden dat alle 102 columns die Eric Sieverts in de jaren 1997-2015 voor vakblad Informatie Professional schreef, nu in één document zijn verzameld. De woordenwolk hierboven die ter gelegenheid van de 100ste column was gemaakt, geeft maar een bescheiden indruk van de gevarieerde onderwerpen die in die lange periode aan de orde kwamen. (Her)lezen dus …

Blijven we nog Googlen?

Gepubliceerd in InformatieProfessional september 2018, onder

TOEKOMST VAN HET ZOEKEN | Eric Sieverts


© Informatie Professional (Uitgeverij IP, Voorburg)

Is Google nog wel een zoekmachine? Er zijn heel wat signalen die maken dat je dat in twijfel kunt trekken.

Van die signalen zijn tal van voorbeelden te geven. Zo viel in de keynote op Google’s ontwikkelaarscongres Google-I/O in mei, met aankondigingen van wel honderd nieuwigheden, slechts tweemaal het woord ‘search.
Maar er is meer.

Verdwijnende functionaliteit

Dat de afgelopen jaren allerlei zoekfunctionaliteit is verdwenen, is al herhaaldelijk door allerlei zoekprofessionals als Phil Bradley, Karen Blakeman of Danny Sullivan gememoreerd. En daaraan lijkt nog geen eind gekomen met recente veranderingen in image search en het afschaffen van het “info:” commando. Soms lijkt het overigens te helpen als je je daar kwaad over maakt. Afgelopen najaar waren er geruchten dat ook twee favoriete tools van dé Nederlandse internet zoekexpert Henk van Ess zouden verdwijnen. De * woord-wildcard en de AROUND(n) afstandsoperator waarmee je naar bepaalde patronen in tekst kunt zoeken. Maar dankzij extra ophef die Henk hierover georganiseerd had, kon hij vlak voor kerst op Twitter melden:

PageRank

Het octrooi op Google’s pagerank, de functionaliteit waaraan Google zijn bijna-monopolie op websearch te danken heeft, is vorig jaar verlopen. De 20 jaar dat een vinding beschermd wordt, waren om. Niet dat Google overigens geld verdiende aan het uitbaten van dat octrooi, want dat stond nog altijd op naam van Stanford University, waar Larry Page en Sergey Brin studeerden toen ze hun nieuwe methode van ranking bedachten. Bovendien lijkt pagerank een steeds minder belangrijke rol te spelen bij het presenteren van zoekresultaten. Een eerste stap in die richting was de personalisatie van de ranking die al jaren geleden zijn intrede deed. Kennis over wat een gebruiker eerder gezocht en bekeken had, begon een net zo belangrijke rol te spelen als de op backlinks gebaseerde pagerank.

Semantiek en intentie

Nog een stapje verder gaan de pogingen van Google om vragen concreet te beantwoorden. In het semantische tijdperk gaat het er niet langer om welke letters een zoeker intikt, maar om de betekenis daarvan. En belangrijker nog, om de intentie van de zoeker. Wat wil die eigenlijk weten? Hoe kan daarop direct antwoord gegeven worden, liefst zonder een lijst met tien blauwe links naar webpagina’s. Daarvoor moeten zoekvragen geïnterpreteerd en begrepen worden, zelfs als die maar uit een enkel woord bestaan. Er wordt hoog opgegeven van de zelflerende algoritmes – deep learning – die hiervoor in de module RankBrain zitten. Maar in de praktijk blijken op veel simpeler niveau de locatie van de gebruiker en het gebruikte apparaat nog de belangrijkste rol te spelen. Zo kreeg ik onlangs in Italië, hoewel persoonlijk bij Google ingelogd, vooral Italiaanse zoekresultaten op mijn niet-Italiaanse zoekvragen. Locatiegegevens bleken veel belangrijker bij het vaststellen van mijn intentie dan wat Google al van me wist. Want thuis bekijk ik vrijwel nooit Italiaanse webpagina’s. Google blijkt zich er overigens van bewust te zijn niet altijd zeker te kunnen weten wat een gebruiker precies bedoelt, zelfs als diens zoekvraag keurig uit een zinnetje bestaat. Om welk aspect of welke invalshoek gaat het? Wil je een oorzaak of een remedie? Om die problematiek op te lossen, geeft Google nu soms twee antwoorden, waaruit de gebruiker kan kiezen. Deze antwoordblokjes worden wel multifaceted featured snippets genoemd. Overigens bestond dat eerder ook al bij zoekmachine Bing.

Antwoordmachine

Van recht-toe-recht-aan zoekmachine is Google dus geëvolueerd tot antwoordmachine. Het is duidelijk dat niet elke informatiespecialist op die ontwikkeling zit te wachten. Een andere beroepsgroep heeft daar om andere redenen trouwens ook problemen mee. In de wereld van de zoekmachineoptimalisatie (SEO) zijn oude voorschriften hoe je webpagina’s hoog laat scoren niet meer zo relevant, als bovenaan de resultatenpagina van een zoekmachine vaak geen webpagina’s maar antwoorden komen te staan. Vandaar ook speciale aanwijzingen hoe je pagina’s moet optimaliseren voor Google’s RankBrain machine learning techniek. Ook nuttig in dat verband is “Five Years of Google Ranking Signals”, een recent uitputtend overzicht door Bill Slawski.

Verdwijnende zoekgoeroes

In het verleden waren er nogal wat zoekgoeroes die Google kritisch volgden, op Twitter en in hun eigen weblogs. Maar veel daarvan zijn intussen verdwenen of doen er meestentijds het zwijgen toe. Gwen Harris (@websearchlady) is met pensioen, van de immer kritische Phil Bradley horen we nog nauwelijks iets [*], Greg Notess en Marydee Ojala schrijven hooguit nog wat in betaalde bladen en van Danny Sullivan komen niet heel veel kritische geluiden meer nu hij, na zijn afscheid bij SearchEngineLand, bij Google zelf in dienst gekomen is. Nu pakt dat laatste soms wel goed uit, want het lijkt dat de eerder genoemde actie van Henk van Ess vooral dankzij hem succes gehad heeft. Op Twitter komen eigenlijk alleen van Karen Blakeman nog serieuze kritische berichten over zoeken met Google. En helaas betreft dat meestal verslechterde primaire zoekfunctionaliteit .

Nieuwe prioriteiten

Tot zover klinkt dit verhaal niet bijster positief. Ik heb het dan ook alleen over de basis van het zoeken gehad en niet over de honderd nieuwtjes die in mei op Google I/O wel aan de orde gekomen waren . Maar die hebben ook maar betrekkelijk weinig met de core business van het zoeken te maken. Die gingen vooral om Google Assistant die je spraakgestuurd in steeds meer talen steeds meer dingen voor je kunt laten doen, nu ook in het Nederlands. Die betroffen AI en machine learning voor heel andere toepassingen dan search. Dat was dat Android beter geschikt wordt voor toepassing in TV, auto’s en Google Assistant. Dat waren nieuwigheden in Google Maps, Photos en News, en ontwikkelingen voor Virtual Reality. En tel zo nog maar even door tot 100.

Overigens zijn er stemmen die denken dat Google zelf wel eens zou kunnen instorten, omdat het op de advertentiemarkt waar het zijn geld verdient, wordt verdrongen door Amazon en Facebook. Dat brengt me dan terug bij mijn beginvraag: ik denk dat we toch nog wel een tijdje zullen blijven Googlen, ook al is de officiële naam van het moederbedrijf tegenwoordig Alfabet. En ook al staat dat werkwoord dan niet meer voor het gestructureerde en gecontroleerde zoeken dat informatieprofessionals prefereren. Of je dat erg moet vinden, laat ik aan de lezer over.


[*] Sinds het verschijnen van dit artikel heeft ook Phil Bradley gemeld dat hij met pensioen gaat en ophoudt met zijn blog en zijn tweets.

.

IP in een nieuw jasje

Ons vakblad IP, medeorganisator van de VOGIN-IP-lezing, heeft met ingang van het eerste nummer in 2018 een nieuwe vormgeving gekregen. Een blik op de geheel vernieuwde buitenkant kunnen we je hier al presenteren. Voor het binnenwerk moet je nog even wachten tot dat eerste nummer binnenkort bij je in de bus ligt. En dat laatste geldt voor iedereen, want als je nog geen abonnee bent, kun je nu gebruik maken van een speciaal voordelig introductieaanbod.