Dit jaar is er in het lezingenprogramma weer eens wat meer aandacht voor het vindbaar maken van informatie door middel van “kennisorganisatiesystemen”. Dat is de wat sjiekere benaming voor wat we vroeger onderwerpsontsluiting plachten te noemen. Er is zowel een lezing over taxonomieën als eentje over “knowledge graphs”. Over die eerste lezing hadden we het eerder al; hier meer over die tweede.
Katariina Kari personificeert een interessante combinatie van competenties: uitvoerend musicus en ITer, en daarbij specifiek het semantisch web. Ze combineerde dat eerder al in het realiseren van de digitale transformatie voor klassieke muziek. Na verantwoordelijk te zijn geweest voor de “Fashion Knowledge Graph” van de grote internationale online modeketen Zalando, werkt ze nu aan de knowledge graph van IKEA.
Als informatieprofessionals kennen we intussen natuurlijk wel de principes van wat een knowledge graph is. Maar het is goed om eens te horen welke achterliggende architectuur daar in de praktijk voor ontwikkeld kan worden, zeker als dat bij zo’n groot alom bekend bedrijf als IKEA is. Katariina gaat er in haar lezing op in hoe zij daarvoor een drie-lagen-model toepast. Dat is ontleend aan de GIST upper ontology for the enterprise. In een artikel in Medium heeft ze dat vorig jaar al eens beschreven. In de eerste plaats zijn er de “soorten dingen” waar het bij het bedrijf om draait. Dat zal vaak maar een beperkt aantal zijn – bij IKEA beschreven met circa 100 centraal beheerde concepten. Die vormen als het ware de “ontologie” met de definitie van klassen en eigenschappen. Daaronder volgen de individuele “dingen”. Eerst in een laag van de onderwerpscategorieën waartoe die dingen behoren. Denk bijvoorbeeld aan iets als boekenkasten. Bij IKEA ligt hun aantal in de duizenden. En daaronder de individuele dingen/produkten zelf, waarvan het aantal bij IKEA – het zal niet verwonderen – wel in het miljoen loopt. Denk daarbij aan iets als “BILLY boekenkast wit 80x28x202 cm”.

Illustration taken from:
https://medium.com/flat-pack-tech/ikeas-knowledge-graph-and-why-it-has-three-layers-a38fca436349
Alleen de concepten voor de eerste twee lagen worden echt door mensen bedacht en bestaan uit gecontroleerd vocabulaire. Voor de grote massa die daaronder volgt, worden de termen automatisch gegenereerd uit de databronnen waarin de gegevens voor die produkten toch al aanwezig zijn. Hoe je dat praktisch kunt organiseren met verantwoordelijkheden, auteurschap en opslag, zal in de lezing ook aan de orde komen.
Deze knowledge graph is (ook) op de klanten van IKEA gericht, om hen een betere digitale “beleving” te kunnen bieden. Voor de interne logistiek van individuele items wordt hij niet gebruikt.
Pingback: Patronen | vogin-ip-lezing