Informatie Professional
13 (2009) nr. 9 (september) blz. 11

Data doen er weer toe

terug

COLUMN
vorige | volgende | nieuwste

 

Eric Sieverts

Vaak wordt de indruk gewekt dat data eigenlijk niets voorstellen, dat het gaat om de informatie die we daaruit kunnen destilleren. En zelfs dat bleek de afgelopen jaren niet goed genoeg. Uiteindelijk zou het alleen nog maar draaien om de kennis die we op basis van die informatie kunnen opbouwen. In een soort raffinageproces krijg je steeds hoogwaardiger producten: van data naar informatie naar kennis.

Toch begon het heilige geloof in kennismanagement de laatste tijd weer wat af te brokkelen. En zelfs lijken we nu terug te keren naar de "data". Eigenlijk ook niet zo gek. Studies, publicaties, teksten - informatie kortom - zijn in de meeste gevallen, in oorsprong gebaseerd op gegevens. Als we dat, enigszins wetenschappelijk, primaire onderzoeksdata noemen, dan was daarvoor al enige tijd aandacht bij DANS (Data Archiving and Networked Services), een dienst van de KNAW, waar wetenschappers hun kostbare data voor de eeuwigheid bewaard en toegankelijk kunnen maken. Alleen ligt die eeuwigheid voor veel betrokkenen nog wel erg ver weg.

Intussen wordt ook bij universiteitsbibliotheken het belang ingezien van primaire onderzoeksdata. Als producten van de wetenschap moeten niet alleen publicaties toegankelijk zijn, maar liefst ook de primaire gegevens waarop die gebaseerd zijn. In Utrecht is daarom een proefproject gestart waarin onderzoeksgroepen hun primaire gegevens kunnen opslaan en zelf kunnen bepalen wie ze daar toegang toe geven. Daarin is Utrecht intussen zeker niet meer de enige.

Software voor dit project was ook gewoon bij Harvard University beschikbaar, waar ze al een paar jaar langer ervaring hiermee hebben.

Ook SURF is recent een werkgroep begonnen die hier onderzoek aan gaat doen. Is het Utrechtse project in eerste instantie vooral gestart vanuit de behoefte van onderzoeksgroepen om in hun virtuele kenniscentra ook onderzoeksgegevens beschikbaar te hebben, voor SURF is het een logische uitbreiding van de repositories waarin universiteiten en hogescholen publicaties van hun medewerkers en studenten opslaan, maar waarin nu ook "complexe documenten", inclusief achterliggende datasets beschikbaar moeten komen.

Misschien nog opmerkelijker dan deze voorbeelden, is dat ook in het kader van het semantisch web "data" de kop opsteken. Het "semantische" aan dat nieuwe web gaat namelijk juist om betekenis en dus om kennis. Toch heeft Tim Berners Lee zelf het begrip linked data ingevoerd. In een interview op de ReadWriteWeb blog noemt hij dat een grass root beweging. Niet van bovenaf door W3C opgelegd, maar door allerlei eigenaren van veel informatie aan de basis, wordt hier gewerkt aan het koppelen en navigeerbaar maken van grote hoeveelheden gegevens. Toch is juist daarvoor nog wel iets meer nodig. Data kun je alleen zinvol koppelen als je er de betekenis van weet, liefst vastgelegd in metadata. Kennis van de betekenis is dus essentieel. Zo komen data en kennis dus toch nog bij elkaar.




© Informatie Professional (Otto Cramwinckel Uitgever, Amsterdam) en Eric Sieverts

Voor een abonnement op Informatie Professional:
bel: 020 - 627 6609

Zie ook IP Online