De IKEA Knowledge Graph

Dit jaar is er in het lezingenprogramma weer eens wat meer aandacht voor het vindbaar maken van informatie door middel van “kennisorganisatie­systemen”. Dat is de wat sjiekere benaming voor wat we vroeger onderwerpsontsluiting plachten te noemen. Er is zowel een lezing over taxonomieën als eentje over “knowledge graphs”. Over die eerste lezing hadden we het eerder al; hier meer over die tweede.

Katariina Kari personificeert een interessante combinatie van competenties: uitvoerend musicus en ITer, en daarbij specifiek het semantisch web. Ze combineerde dat eerder al in het realiseren van de digitale transformatie voor klassieke muziek. Na verantwoordelijk te zijn geweest voor de “Fashion Knowledge Graph” van de grote internationale online modeketen Zalando, werkt ze nu aan de knowledge graph van IKEA.

Als informatieprofessionals kennen we intussen natuurlijk wel de principes van wat een knowledge graph is. Maar het is goed om eens te horen welke achterliggende architectuur daar in de praktijk voor ontwikkeld kan worden, zeker als dat bij zo’n groot alom bekend bedrijf als IKEA is. Katariina gaat er in haar lezing op in hoe zij daarvoor een drie-lagen-model toepast. Dat is ontleend aan de GIST upper ontology for the enterprise. In een artikel in Medium heeft ze dat vorig jaar al eens beschreven. In de eerste plaats zijn er de “soorten dingen” waar het bij het bedrijf om draait. Dat zal vaak maar een beperkt aantal zijn – bij IKEA beschreven met circa 100 centraal beheerde concepten. Die vormen als het ware de “ontologie” met de definitie van klassen en eigenschappen. Daaronder volgen de individuele “dingen”. Eerst in een laag van de onderwerps­categorieën waartoe die dingen behoren. Denk bijvoorbeeld aan iets als boekenkasten. Bij IKEA ligt hun aantal in de duizenden. En daaronder de individuele dingen/produkten zelf, waarvan het aantal bij IKEA – het zal niet verwonderen – wel in het miljoen loopt. Denk daarbij aan iets als “BILLY boekenkast wit 80x28x202 cm”.

Alleen de concepten voor de eerste twee lagen worden echt door mensen bedacht en bestaan uit gecontroleerd vocabulaire. Voor de grote massa die daaronder volgt, worden de termen automatisch gegenereerd uit de databronnen waarin de gegevens voor die produkten toch al aanwezig zijn. Hoe je dat praktisch kunt organiseren met verantwoordelijkheden, auteurschap en opslag, zal in de lezing ook aan de orde komen.
Deze knowledge graph is (ook) op de klanten van IKEA gericht, om hen een betere digitale “beleving” te kunnen bieden. Voor de interne logistiek van individuele items wordt hij niet gebruikt.

Hoezo een knowledge graph?

Dat inhoudelijke ontsluiting nuttig is om informatie makkelijker vindbaar te maken voor klanten of voor andere geïnteresseerden, dat weet elke IP’er wel. Dat je daarvoor een taxonomie of een thesaurus kunt gebruiken is niets nieuws. Met een Knowledge Graph ligt dat nog wat anders. Vaak wordt zoiets nog gezien als het speeltje van Google, waarmee ze proberen concrete antwoorden op onze zoekvragen te geven. En eigenlijk ook een beetje als een tech-hype.
Toch zijn er steeds meer organisaties die hun eigen Enterprise Knowledge Graph ontwikkelen, omdat ze daar allerlei voordelen in zien. En die voordelen variëren van betere toegankelijkheid van hun informatie tot het krijgen van beter overzicht over hun eigen producten en de onderlinge relaties daartussen. Het is dus niet voor niets dat in ons programma zowel een lezing als een workshop aan dit onderwerp gewijd zijn.

In de workshop van Joyce van Aalten en Daphne Shinn leer je niet alleen hoe een Knowledge Graph werkt, maar ook hoe je er zelf een maakt – hands-on. Heel praktisch gericht dus.
In de lezing van Paula Kassenaar gaat het er vooral om hoe bij Zalando zo’n Knowledge Graph gebruikt wordt. Zowel ten behoeve van de klanten, zodat die makkelijker de producten kunnen vinden waar ze in geïnteresseerd zijn, als ten behoeve van het bedrijf zelf, om alle informatie over haar producten bij de hand te hebben. En uiteraard komt ook aan de orde hoe ze dat bij Zalando hebben aangepakt en hoe daar de graph wordt onderhouden.
Deze twee invalshoeken kun je ook nog combineren door ‘s ochtends de lezingen te bezoeken en ‘s middags naar die workshop te gaan.