In de Volkskrant van afgelopen zaterdag stond een uitgebreid interview met professor Arnold Smeulders over automatische (digitale) beeldherkenning, onder de aansprekende titel “Een vleugje Silicon Valley aan de universiteit”.
Automatische beeldherkenning is begonnen als een tamelijk academisch onderwerp. Maar met de opkomst van digitaal beeld – foto’s en video – en vooral de huidige explosie daarvan in de sociale media, is het van steeds groter praktisch belang geworden. Ook voor steeds meer commerciële bedrijven, van makers van chips voor mobieltjes tot Google (+) zelf. Of zoals Smeulders in het Volkskrant-interview zegt: “ Het is raar: iedereen is nu bezig met digitale plaatjes, met het onderwerp waar ik al dertig jaar mee bezig ben. Ik weet niet wat me overkomt.”
De Amsterdamse universitaire onderzoeksgroep van Smeulders en (tot voor kort) Cees Snoek speelt al heel lang een vooraanstaande rol in het onderzoek op dit terrein. Zoals uit het Volkskrant-artikel blijkt, weten zij echter ook goed de verbinding met de commerciële praktijk te leggen.
Een van de VOGIN-IP-lezingen op 26 maart is ook aan dit onderwerp gewijd. Thomas Mensink, uit die zelfde onderzoeksgroep van Smeulders aan de UvA, vertelt ons dan over de nieuwste ontwikkelingen op dit gebied. Tot nu toe werden in de meeste gevallen technieken van “machine learning” toegepast. Daarbij leert de computer op basis van een heleboel voorbeelden hoe een bepaald object te herkennen is, ook als het in verschillende omgevingen of vanuit verschillende hoeken gezien wordt. Maar voor elk te herkennen onderwerp/object moet dat afzonderlijk gedaan worden. De heilige graal van beeldherkenning is daarom natuurlijk dat een computer ook zelfstandig nieuwe onderwerpen kan herkennen, waarop hij nog niet getraind is. Dat is waar Thomas Mensink zich nu mee bezig houdt en waar hij ons over gaat vertellen.