Schema.org semantische markup

image by DCMIIn IP is een nieuwe rubriek gestart, “Dat zoeken we op”. In de eerste aflevering merkte Eric Sieverts op dat restaurantzoek- en beoordeelsite IENS ook al gebruik maakt van semantische (of gestructureerde) markup. Je ziet dat onder meer aan de manier waarop IENS-pagina’s in zoekresultaten van Google terecht komen, met vermelding van gestructureerde gegevens zoals plaats en buurt, beoordeling en prijsniveau, de zogenaamde “rich snippets”. iens Voor het benoemen van allerlei soorten eigenschappen, verwerkt in de HTML-code van webpagina’s, wordt gebruik gemaakt van de standaard Schema.org. De grote zoekmachines Google, Yahoo!, Bing en Yandex die bij de ontwikkeling hiervan samenwerken, kunnen die gegevens daardoor herkennen. Schema.org zou je dus een metadatamodel kunnen noemen; sommigen spreken zelfs al van een “ontologie”.schema Wie hebben eigenlijk belang bij dit soort codering? Wij zoekers in elk geval. Voor ons is het handig dat we sneller en beter zien wat we eigenlijk gevonden hebben. Maar waarom nemen eigenaars van websites de moeite – zoals bij IENS – om die markup aan webpagina’s toe te voegen? Voornaamste reden daarvoor is dat die vorm van markup intussen een belangrijk onderdeel is van Search Engine Optimalisatie. Als wij sneller herkennen of het gevondene aan onze behoefte voldoet, klikken we sneller en gerichter op zo’n link, en dat is natuurlijk in het belang van website-eigenaars. Zelfs wordt gefluisterd dat sites die Schema.org toepassen door zoekmachines sowieso al hoger gerankt worden. Intussen doen al cijfers de ronde dat dit soort codering aanwezig is in 30% van de resultaten die uit een gemiddelde Google zoekactie komen. Maar voor het Nederlandse deel van internet bestaat de indruk dat die codering nog veel minder algemeen is – IENS is dus een beetje een voorloper. itemprop Het is wellicht wat onverwacht dat het niet alleen sectoren als e-commerce, horeca en receptenwereld zijn waar Schema.org opgang doet, maar dat zelfs de beeldende kunst geïnteresseerd is, zoals uit een recente “Art & Technology blog” blijkt.

Wie meer over de schema’s van enkele van die sectoren wil weten, moet maar eens op de site van Schema.org kijken bij schema.org/Restaurant, schema.org/Recipe of schema.org/VisualArtwork.
En tijdens de VOGIN-IP-lezing moet je dan zeker naar de lezing van Peter Mika, want die is vanuit zijn functie bij Yahoo! een van de mensen die aan de verdere ontwikkeling en toepassing van Schema.org werkt. Hij zal dus zeker al onze vragen hierover kunnen beantwoorden.

Beeldherkenning

smeulders
In de Volkskrant van afgelopen zaterdag stond een uitgebreid interview met professor Arnold Smeulders over automatische (digitale) beeldherkenning, onder de aansprekende titel “Een vleugje Silicon Valley aan de universiteit”.
Automatische beeldherkenning is begonnen als een tamelijk academisch onderwerp. Maar met de opkomst van digitaal beeld – foto’s en video – en vooral de huidige explosie daarvan in de sociale media, is het van steeds groter praktisch belang geworden. Ook voor steeds meer commerciële bedrijven, van makers van chips voor mobieltjes tot Google (+) zelf. Of zoals Smeulders in het Volkskrant-interview zegt: “ Het is raar: iedereen is nu bezig met digitale plaatjes, met het onderwerp waar ik al dertig jaar mee bezig ben. Ik weet niet wat me overkomt.
De Amsterdamse universitaire onderzoeksgroep van Smeulders en (tot voor kort) Cees Snoek speelt al heel lang een vooraanstaande rol in het onderzoek op dit terrein. Zoals uit het Volkskrant-artikel blijkt, weten zij echter ook goed de verbinding met de commerciële praktijk te leggen.
Een van de VOGIN-IP-lezingen op 26 maart is ook aan dit onderwerp gewijd. Thomas Mensink, uit die zelfde onderzoeksgroep van Smeulders aan de UvA, vertelt ons dan over de nieuwste ontwikkelingen op dit gebied. Tot nu toe werden in de meeste gevallen technieken van “machine learning” toegepast. Daarbij leert de computer op basis van een heleboel voorbeelden hoe een bepaald object te herkennen is, ook als het in verschillende omgevingen of vanuit verschillende hoeken gezien wordt.euvision examples Maar voor elk te herkennen onderwerp/object moet dat afzonderlijk gedaan worden. De heilige graal van beeldherkenning is daarom natuurlijk dat een computer ook zelfstandig nieuwe onderwerpen kan herkennen, waarop hij nog niet getraind is. Dat is waar Thomas Mensink zich nu mee bezig houdt en waar hij ons over gaat vertellen.

Aanmelding open

http://en.wikipedia.org/wiki/German_keyboard_layout#mediaviewer/File:Keyboard_on_a_German_mechanical_Olympia_typewriter.jpg
Vorige week is de registratie van aanmeldingen voor de VOGIN-IP-lezing officieel geopend.
Wacht niet te lang met inschrijven, want aan de workshops kunnen maar beperkte aantallen belangstellenden deelnemen. En wie het eerst komt (lees: registreert) het eerst maalt.
En als u wel te lang wacht? Voor u nog geen nood, want parallel aan de workshops zijn er ook uiterst interessante lezingen – zonder beperking op de aantallen toehoorders. …..
Maar voor ons dan wel nood, want wij willen graag tijdig weten hoeveel deelnemers we ongeveer kunnen verwachten, zodat we ook de workshops al kunnen indelen.
Raadpleeg dus snel het programma en maak uw keuzes.

Dan zijn er altijd nog de foto’s ….

Foto's van Marina Noordegraaf

Het was een mooie dag gisteren. In ieder geval vindt u hier op Flickr al 245 foto’s die een mooi beeld bieden van de workshops, de lezingen, de wandelgangen en de nazit. Fotograaf: Marina Noordegraaf.

Volgende week komen we ook nog even bij u terug met een digitaal evaluatieformulier, zodat we het volgend jaar nog beter, interessanter, spannender en gezelliger kunnen maken.

Volgeboekt?

aanmeldingenHet was onverwacht hoe snel de aanmeldingen voor de VOGIN-IP-lezing binnenkwamen en en hoe veel dat er werden. In bijgaand grafiekje kunt u het verloop van de inschrijvingen van vorig jaar en dit jaar vergelijken. Dat illustreert aardig hoe verrast wij waren. Het kwam dus wel heel slecht uit dat we hadden moeten uitwijken naar een zaal met een maximum capaciteit die maar heel weinig groter was dan het aantal bezoekers van de lezingen vorig jaar.

Maar we hebben inderdaad geregeld dat de lezingen vanuit een andere zaal op groot scherm gevolgd kunnen worden. Degenen die zich hadden aangemeld nadat de limiet bereikt was (en bij aanmelding hadden aangegeven daar geen bezwaar tegen te hebben), hebben intussen al bericht gehad dat ze in die andere zaal terecht kunnen. Als u ook alsnog tot dat (selectere) gezelschap wilt behoren kunt u zich nog altijd opgeven. In die meekijkzaal is nog een tiental plaatsen beschikbaar. Maar dan moet u zich wel uiterlijk vrijdag 14 maart hebben aangemeld.
Ook bij de meeste workshops zijn geen stoelen meer vrij. Alleen bij die van Boyd Hendriks en Jeroen Bosman is nog een zeer beperkt aantal plaatsen beschikbaar.

En dan nog iets: het is alleen dankzij onze sponsoren, LM Information Delivery. GO Opleidingen, Swets, LexisNexis, Springer, Hatch en (onze eigen) KNVI, dat we het inschrijfgeld voor deze dag zo laag hebben kunnen houden. Deze sponsoren zullen op 20 maart ook in de Industrieele Groote Club aanwezig zijn.

Vertrouwt u alleen op Google?

trust2 Inlichtingendiensten hebben dezer dagen een slechte naam gekregen. Toch zal Arno Reuser in zijn lezing beweren dat informatieprofessionals nog wel iets kunnen leren van de manier waarop daar naar informatie wordt gekeken.
In ons vak is Arno vooral bekend als moderator en organisator van onze Nedbib discussielijst. Maar daarnaast laat hij anderen ook meeprofiteren van de kennis die hij opdeed uit zijn contacten met inlichtingendiensten. Contacten die uit zijn werkomgeving voortkwamen.
Zo bekommert hij zich nogal om methoden om zo te zoeken dat je geen (of zo weinig mogelijk) sporen van je zoektochten achterlaat. Een ander belangrijk aspect bij inlichtingendiensten is natuurlijk de nadruk die daar ligt op het bepalen van de betrouwbaarheid van gevonden informatie.

Die betrouwbaarheid moet natuurlijk van nature al hoog in het vaandel staan bij iedere informatieprofessional, maar in de praktijk is bij veel organisaties de tijdsdruk vaak zo groot – en is er vaak ook zoveel informatie – dat daaraan onvoldoende aandacht kan worden besteed. Met als gevolg dat ook in professionele omgevingen regelmatig ongevalideerde informatie in omloop wordt gebracht. trust
Omdat inlichtingendiensten de lat wel altijd een tikje hoger moeten leggen, zal Arno in zijn lezing vanuit die achtergrond ingaan op analyse-techieken die het mogelijk maken om die validatieproblematiek het hoofd te bieden.

Market Intelligence bij AkzoNobel

oneintelAkzoNobel is een belangrijke wereldwijde speler op het gebied van verf en coatings, maar doet ook veel in de sector van de speciale chemie. In zo’n bedrijf speelt competitive intelligence uiteraard een belangrijke rol. Robert Jan Alting von Geusau heeft een project geleid om die informatie-voorziening te verbeteren. Efficiëntie, kosteneffectiviteit en brede toegankelijkheid van ingekochte externe informatie waren daarbij belangrijke uitgangspunten.
In zijn lezing zal Robert Jan ingaan op het verzamelen van de wensen vanuit de diverse gebruikersgroepen en op het keuzetraject voor het aanschaffen van een systeem. Maar een ministens zo belangrijke stap was de uiteindelijke implementatie van het systeem. De overwegingen, keuzes en beslissingen daarbij zullen aan de orde komen. Ook de keuze om verschillende doelgroepen hun eigen ingang op het systeem te geven. De zo gerealiseerde Centrale Intelligence Website is onder de naam “OneIntelligence” het bedrijf ingegaan. Toehoorders van de lezing zullen ook te zien krijgen hoe dat eruit ziet.

Een paar uitspraken uit een eerdere presentatie:
# Manage expectations. Users sometimes expect “instantaneous automation”.
# OneIntelligence makes things more efficient but doesn’t automate everything.
# The quality of the content determines the value that people will get from the system.

Nog 4 weken en nog 10 stoelen

foto: Mor, Flickr
Nog vier weken en er zijn nog maar tien stoelen vrij!
Een onverwacht grote menigte heeft zich al aangemeld voor het middag-programma van de VOGIN-IP-lezing. En dat terwijl er nog vier weken te gaan zijn tot 20 maart.

Omdat we het wel erg sneu vinden als nu al niemand zich meer zou kunnen aanmelden en we ook niet de Arena willen afhuren, zijn we druk bezig om te regelen dat op een scherm in een zijzaal kan worden meegekeken. Uiteraard tegen gereduceerd tarief. Blijft u zich in elk geval dus nog maar even aanmelden. U krijgt dan vanzelf te horen of het gaat lukken. En ook op deze plek zullen we u op de hoogte houden. En sowieso komen aanmelders 11 en verder op de wachtlijst voor te ontvangen afmeldingen.
Voor de workshops in de ochtend zijn in elk geval nog wat plaatsen vrij. Dat geldt voor de workshops van:
– Boyd Hendriks   (nog 10 plaatsen)
– Joyce van Aalten   (nog 6 plaatsen)
– Jeroen Bosman   (nog 12 plaatsen)
– Marydee Ojala   (nog 4 plaatsen)

De VOGIN-IP-lezing
VOGIN en InformatieProfessional bieden een programma vol van
de nieuwste informatie en inzichten rond zoeken en vinden.
Een update en hernieuwde kennismaking voor oud-VOGINcursisten.
Een verdieping en update voor lezers van InformatieProfessional.
Voor iedereen een vervolg op de succesvolle IP-lezingen uit vroeger jaren.

Antoine Isaac over semantische technieken in Europeana

Begin januari was er in de blogosphere enige heftige discussie over het Semantisch web. Er werd geklaagd dat het er nog altijd niet was, en dat het in feite heel langzaam nergens heen ging. Een antwoord van echte Semantisch Web adepten liet natuurlijk niet lang op zich wachten. Inderdaad is nog niet het hele concept gerealiseerd (net zo min als vliegende auto’s, het geneesmiddel tegen kanker en reizen naar Mars), maar intussen zijn wel al allerlei onderdelen in practische toepassingen verwerkt.
antoine-slide0 Over dat soort toepassingen zal Antoine Isaac het op de VOGIN-IP-lezing hebben. Zijn verhaal is gebaseerd op de presentatie Semantic Web Technology in Europeana, die in november op het congres Semantic Web in Libraries in Hamburg is gegeven. Die lezing was voor een nogal technisch publiek. Bij ons zal hij het vertellen op een manier die ook voor minder technische toehoorders te begrijpen is. Maar de elementen die u hierboven op het beginscherm van die Hamburgse Prezi ziet staan, komen op 20 maart ook alle drie aan de orde – metadata modelling, ingestion (hoe het spul van al die verschillende organisaties soepel in Europeana terecht komt) en dissemination/publishing.
antoine
Wie vooraf nog meer recente presentaties van Antoine wil zien, kan ook kijken naar

.
PS:
Over de lezingen van Marydee Ojala en Maarten de Rijke schreven we hier al eerder.
Naar aanleiding van de overige twee lezingen, zal hier later nog wat extra informatie komen, aanvullend op wat daarover al op de lezingenpagina staat.

De VOGIN-IP-lezing
VOGIN en InformatieProfessional bieden een programma vol van
de nieuwste informatie en inzichten rond zoeken en vinden.
Een update en hernieuwde kennismaking voor oud-VOGINcursisten.
Een verdieping en update voor lezers van InformatieProfessional.
Voor iedereen een vervolg op de succesvolle IP-lezingen uit vroeger jaren.

Terugblik op interessante dag

zaal

foto: Wouter Gerritsma

We denken dat een heleboel vakgenoten gisteren een interessante dag hebben gehad. De workshops waren goed bezet. De lezingen zorgden voor afwisseling, maar sloten niettemin goed op elkaar aan. Er werd veel getwitterd, vooral als men het niet eens was met een boude uitspraak van een spreker. En de borrel na afloop was zo geanimeerd dat de aanwezigen – anders dan meestal het geval is – aan het eind met zachte drang naar de uitgang gedirigeerd moesten worden.

Gelukkig is niet alleen in de hoofden van de bezoekers, maar ook op deze website nog iets overgebleven van deze dag. U vindt hier de presentaties, de verzamelde tweets en live blogs en ook al wat foto’s.

En uiteraard hopen we dat u er volgend jaar ook weer bij bent.