Podiumkunstendata op Wikidata: de stap naar échte linked open data

PACKED zet al een tijdje in op open data in de cultuursector en experimenteert sinds enkele jaren ook met Wikimediaplatformen om de publieke zichtbaarheid en vindbaarheid van het erfgoed te vergroten. Specifiek rond de podiumkunsten organiseerde PACKED sinds het voorjaar van 2017 schrijfsessies op Wikipedia, waarbij heel wat nieuwe artikels werden geschreven en bestaande artikels werden verbeterd. Kunstenpuntdata op Wikidata publiceren was een volgende stap in de exploratie van de mogelijkheden van Wikimediaplatformen voor de podiumkunsten.

Waarom de data van Kunstenpunt?

We wilden graag uittesten hoe data al van bij aanvang rijker worden door ze als linked open data op Wikidata te publiceren. Ook waren we benieuwd naar de mate van verrijking die achteraf door de community zou ontstaan.

De geüploade data gaan over productiebeschrijvingen sinds 1993. Deze productiedata uit de Kunstenpuntdatabank zijn interessant omdat verschillende soorten data gelinkt kunnen worden met andere data die al beschikbaar zijn op Wikidata. Denk bijvoorbeeld aan speelplekken, personen en organisaties die aan producties gelinkt zijn. De potentiële verrijking die zo ontstaat komt zowel de algemene beschikbaarheid van online kennis als Kunstenpunt zelf ten goede.

Kunstenpunt is niet de eerste organisatie die met data over podiumproducties aan de slag gaat op Wikidata. In Zwitserland loopt een interessant project rond historische theaterproducties. De upload van de Kunstenpuntdata pakten we maximaal volgens dezelfde logica aan.

Verrijking

Circa 1700 van de geüploade venues hebben op Wikidata specifieke geocoördinaten, waardoor ze heel precies op een kaart kunnen worden weergegeven. De Wikidata query tool maakt dat ook mogelijk. Kunstenpunt krijgt dus op slag van de belangrijkste venues uit de database geocoördinaten als verrijking cadeau.

Een query laat toe om overzichtelijk te visualiseren in welke soorten venues Vlaamse (co-producties) de jongste 25 jaar in première gingen. Dat zijn gegevens die niet in de Kunstenpuntdatabank, maar wel in Wikidata zitten. Evidente categorieën als theater, cultuurcentrum en kunstencentrum vormen duidelijk de grootste groep, maar het is interessant om te zien hoe minder voor de hand liggende categorieën als bioscoop, kerkgebouw, kasteel, (kunst)museum, school, plein of fabriek op deze manier zichtbaar worden als plekken waar podiumkunstenvoorstellingen plaatsvinden.

Door de transformatie naar Linked Open Data (LOD) wordt ook de contextuele informatie rondom de gelegde links zoals plaats van opleiding, nationaliteit en relaties aanschouwelijk gemaakt. De wikidata query service staat toe om deze verschillende knooppunten (nodes) visueel in kaart te brengen waardoor al snel duidelijk wordt waarin de kracht van Linked Open Data schuilt; het eindeloos in verbinding stellen van verschillende concepten en onderwerpen die elk op zich nieuwe metadata introduceren. vb. Anne Teresa de Keersmaeker.

Door de koppeling met Wikidata zijn de Kunstenpuntdata op slag ook gekoppeld met heel wat afbeeldingen van venues en personen. Meer dan 2000 personen en meer dan 750 venues uit de Kunstenpuntdatabank hebben al een foto op Wikidata. Aangezien die foto’s onder een vrije licentie op Wikimedia Commons staan, zijn ze door iedereen herbruikbaar.

Met de WikiData Free Image Search Tool is het ook mogelijk om op basis van een SPARQL-query op Wikimedia Commons te zoeken naar afbeeldingen van Wikidata-items die nog geen gelinkte afbeelding hebben en die meteen te koppelen aan het juiste item. Met deze query kun je bijvoorbeeld zoeken naar afbeeldingen voor venues uit de Kunstenpuntdatabank:

Door de koppeling ontstaat heel wat verrijking van de Kunstenpuntdata. Bovendien stopt die verrijking niet op het moment dat de data gekoppeld worden. Doordat de data op Wikidata continu worden bijgewerkt door een brede gemeenschap van mensen ontstaat er steeds verdergaande verrijking. Steeds meer taalversies van Wikipedia en andere Wikimediaprojecten (bv. Wikimedia Commons) introduceren infoboxen die rechtstreeks gestructureerde gegevens putten uit Wikidata. Dat genereert een grotere zichtbaarheid van de data, wat ertoe leidt dat een grotere groep mensen deze informatie kan valideren en indien nodig aanpassen. Enkele voorbeelden van data die na de upload van de Kunstenpuntdata door Wikidatagebruikers werden toegevoegd:

En cours de route

Tijdens de voorbereiding voor de data-upload werden inconsistente of foute data die we in de Kunstenpuntdatabank tegenkwamen gesignaleerd en opgeschoond. Sommige url’s van organisatiewebsites waren bijvoorbeeld verouderd en werden niet meegenomen in Wikidata. Voor sommige organisaties en personen zijn met behulp van de Wikidata community intussen recentere gegevens beschikbaar als linked open data. De dubbele personen die we in de Kunstenpuntdatabank detecteerden werden gesignaleerd en op Wikidata alvast samengevoegd tot één item.

Toekomstmogelijkheden voor Kunstenpunt

Alle informatie op Wikidata valt onder CC0 en is dus ook voor Kunstenpunt zonder enige beperking vrij herbruikbaar. De verrijkte data die door de upload naar Wikidata is ontstaan, kan Kunstenpunt dus zelf opnieuw binnentrekken via de Wikidata API en bijvoorbeeld gebruiken binnen het eigen onderzoek of om de Vlaamse kunstensector op de eigen website aantrekkelijker te presenteren. Door de Wikidata Q-nummers op te nemen in een veld in de Kunstenpuntdatabank wordt het mogelijk om alle op Wikidata beschikbare data zelf opnieuw binnen te trekken. Aangezien Wikidata de plek is die verschillende Wikimediaplatformen met elkaar verbindt, gaan de mogelijkheden zelfs verder dan Wikidata. Zo is het denkbaar dat Kunstenpunt tekst van Wikipediapagina’s in verschillende talen laat zien op de eigen website om meer context te bieden bij bepaalde actoren uit de sector. Ook deSingel experimenteert hier op dit moment mee. Het aantal artiesten in hun omvangrijke online archief is namelijk zo groot geworden dat deSingel dankbaar gebruik maakt van Wikipedia om deze namen van extra duiding te voorzien (zie bv. Hanna-Elisabeth Müller).

Ander relatief laaghangend fruit: geocoördinaten van venues kunnen dienen om de eigen geografische data op kaart te plotten. Door de community geüpdatete url’s van officiële websites van organisaties of personen kunnen in de eigen databank weergegeven worden, net als links naar sociale media-accounts van kunstenaars en kunstenorganisaties (Twitter, Facebook,…).

De verdere verrijking van de Wikidata-items uit de Kunstenpuntdatabase kan eenvoudig opgevolgd worden aan de hand van de unieke identifiers zijn opgenomen in Wikidata zijn opgenomen. Recent gewijzigde items van personen uit de Kunstenpuntdatabase vind je bijvoorbeeld hier.

Een ander neveneffect van de upload naar Wikidata is dat Kunstenpunt nu eigen Wikidata properties heeft voor personenorganisatiesvenues en producties. Door te linken met bestaande data wordt Kunstenpunt op Wikidata een autoriteit die gekoppeld is aan andere autoriteiten binnen het domein van de podiumkunsten (lesarchivesduspectacleEuropean Theatre Architecture Database,…) en daarbuiten (bv. IMDbGoogle Arts & CultureMusicBrainz,…) Die koppeling is op zich een extra meerwaarde wanneer Kunstenpunt ooit deze andere data bij het onderzoek wil betrekken. Zeker wanneer die andere externe identifiers over een API beschikken die het mogelijk maakt om de achterliggende data te bevragen.

Hoe de data-upload naar Wikidata gebeurde, lees je op deze projectpagina.

Je leest: Podiumkunstendata op Wikidata: de stap naar échte linked open data