Loading…
Tilbage

Velkommen! Om brug af semantic web-standarder til sammenkobling af data


03-09-2009 07:08:46

Velkommen til denne nye gruppe på Digitalisér.dk med fokus på brugen af semantic web-standarder indenfor det offentlige med det formål at udbredelsen af teknologier, som kan sikre ægte semantisk interoperabilitet indenfor den offentlige sektor.

Indtil nu har indsatsen omkring dataudveksling indenfor det offentlige groft sagt været fokuseret omkring brugen af XML-skema, der desværre giver ret begrænsede muligheder for at dele og sammenkoble viden i form af vidensbeskrivelser, metadata og lignende på tværs af datasiloer.

Et nyere initiativ, som går i samme retning, er det nye "Datakildekatalog" på Digitalisér.dk. Initiativet kan ses som et forsøg på at samle en større gruppe af data, end de data, som er tilgængelige via XML-skema og web services (selvom disse også er indeholdt i kateloget som såkaldt maskinlæsbare data), og et forsøg på at repræsentere denne datasamling på en ny måde.

Der er dog stadigvæk et udækket behov for maskinlæsbare semantiske oplysninger, også på sådan noget som datakildekataloget. Det skal som datakildeudbyder være muligt at beskrive sine data i et fælles (maskinlæsbart) sprog, således at andre umiddelbart kan se, hvad data "betyder". På den måde vil semantiske crawlere automatisk kunne sammenkoble data og bygge en tværgående database baseret på data fra lokalt vedligeholdte siloer, som giver helt nye muligheder for datafremfinding, overblik og aggregering.

Teknologierne som muliggør dette findes allerede under W3C's semantic web initiativ og anvendes mange steder i dag. Sproget RDF/OWL er centralt i denne sammenhæng.

For at semantic web "enable" sine data kræves to ting:

1) Et vokabular, som beskriver data helt konkret (det som nogen ville kalde semantik). Et vokabular bruges på tværs af datasiloer og vil være uafhængigt af de konkrete databaseimplementationer.

2) Et udbud af semantisk opmarkerede data. Dette kan foregå enten direkte ved at udbyde sine data i RDF/OWL-format med en web service. En anden mulighed, hvis ens data allerede udbydes på en webside, er at opmærke data direkte i HTML ved hjælp af RDFa, som kan indlejre semantisk information direkte i HTML.

I denne gruppe vil vi løbende komme med eksempler, dokumentation og debat omkring emner som disse.

Mvh.

Rune Stilling, RDFined