Loading…
Tilbage

Fælles begrebs- og datakatalog


At sammenføje data kræver i dag en ofte uforholdsmæssig stor indsats af tid og penge, primært fordi data ikke er tilgængelige på en måde, hvor både syntaks og semantik følger fastlagte computerforståelige standarder. At det i dag ikke er en naturlig ting hurtigt at sammensætte data efter et opstået behov eller en nyfunden interesse beviser udskrivningen af denne konkurrence.
Data skal kunne findes og sammenkædes uden nødvendigvis at inddrage udviklere, hvis almindelige borgere skal få gavn af disse data. Et væsentligt skridt for at nå det mål er at få opmærket data med syntaktisk OG semantisk entydighed blandt andet ved brug af RDF (Resource Desription Framework) og OWL ( Web Ontology Language ).
Men før vi tager det skridt, er det vigtigt, at vi finder en fælles forståelse, at vi bliver enige om ,hvad et ord, et begreb eller et tag på en webside betyder.
Vi har brug for en dansk, semantisk wikipedia, der kan vedligeholdes af brugere og anvendes af computere.
1. Hvad er produktet?
Produktet er et dynamisk brugerstyret katalog over sammenhæng mellem begreber og data, samt deres entydige samantiske opmærkning til brug for sammenkædning af data.
2. Hvordan fungerer produktet?
Produktet er et web site opbygget efter samme åbne princip som wikipedia: Alle kan oprette en begrebsdefinition og alle har ret til at blande sig og give en definition eller kommentar.
3. Hvad består produktet af?
Overordnet set består produktet af:

  • Begrebsdefinitioner
  • Ontologier
  • Referencer til kendt anvendelse
  • Videndeling

Begrebsdefinitioner

For alle nedenstående udgaver af begrebsdefinitionen gælder det, at begrebet beskrives i sammenhæng med andre ord og begreber. Beskrives eksempelvis begrebet ’Borger’ vil relationen til andre begreber som ’Vælger’, ’Skatteyder’, ’Statsborger’, ’Person’, ’Patient og så videre, blive inddraget.
Hvert begreb vil kunne optræde i nedenstående udgaver:

  • En bredt accepteret, fyldestgørende beskrivelse i et letforståeligt dansk. Dette er grundlaget for en bred anvendelse og for en minimering af fejltolkninger.
  • Et UML-klassediagram med brug af den udvidede notationsform ODM (Ontology Definition Metamodeling). UML-diagrammerne kan downloades i XMI-formatet og anvendes af udviklere.
  • En XML-beskrivelse af begrebet. Beskrivelsen defineres på basis af XML-repræsentationen af den internationale standard OWL og det til denne udviklede xml-schema.
  • En RDF/XML beskrivelse der opfylder OWL 2 standarden.
  • Optionelt vil en Topic Maps-beskrivelse også kunne gives.
  • Hvert begreb har sin unikke http-baserde URL, der umiddelbart kan anvendes af udviklere og webdesignere  til entydig identifikation.

Ontologier
I takt med opbygningen af dette katalog af entydigt identificerbare begreber vil en række ontologier, eller begrebsmodeller, udkrystalisere sig. Vi vil på denne måde kunne skabe både kerneontologier, der har anvendelse på tværs af faggrænser, samt domænespecifikke ontologier hvis udbytte er størst indenfor enkelte faggrupper.
Et væsentligt plus er, at vi ved denne fremgang kan sikre den tværgående kobling af data uden at skulle nedsætte tunge, langsomt arbejdende udvalg.
Referencer til kendt anvendelse
For at kunne sammenflette data skal man naturligvis have data at flette med. I tilknytning til de enkelte begreber vises en oversigt over kendte, webtilgængelige datakilde, hvor begrebet anvendes.
Videndeling
Viden omkring semantisk opmærkning og anvendelse er en betingelse for at udbrede den semantiske opmærkning og derved for at sikre muligheden for let og hurtig sammenkædning af data. Web sitet bør derfor som en væsentlig del af aktiviteterne have som formål at udbrede viden om semantiske teknologier.
4. Hvilke datakilder skal bruges?
Ved opstarten af kataloget vil de primære datakilder være de personer der i dag har den viden der endnu ikke er udtrykt som semantisk opmærkede data. I takt med katalogets opbygning vil eksterne datakilder i form af ontologier blive tilkoblet og integreret med kataloget.
5. Hvem vil bruge produktet?
Det forventes, at der i vid udstrækning vil være et sammenfald mellem ’nydere og ydere’ af dette begrebs- og datakatalog.
Webdesignere samt web- og dataudviklere vil være de primære brugere af katalogets definitioner, når der skal stilles data til rådighed for kunder, borgere og andre eksterne brugere. Jo mere man ser værdien i kataloget, jo større vil viljen til at levere ny viden til kataloget være. Og omvendt.
Datadefinitioner skal ikke længere udelukkende være et anliggende for en offentlig myndighed eller for en udvalgt gruppe af tekniske eksperter. Alle skal kunne deltage i denne proces. Mange vil kunne give gode definitioner på et klart og letforståeligt dansk, andre vil kunne levere  OWL, RDF og XML-opmærkningen.