Loading…
Tilbage
×

Info

Der findes en nyere version af resourcen her

Fælles begrebs- og datakatalog


At sammenføje data kræver i dag en ofte uforholdsmæssig stor indsats af tid og penge, primært fordi data ikke er tilgængelige på en måde, hvor både syntaks og semantik følger fastlagte computerforståelige standarder. At det i dag ikke er en naturlig ting hurtigt at sammensætte data efter et opstået behov eller en nyfunden interesse beviser udskrivningen af denne konkurrence.
Data skal kunne findes og sammenkædes uden nødvendigvis at inddrage udviklere, hvis almindelige borgere skal få gavn af disse data. Et væsentligt skridt for at nå det mål er at få opmærket data med syntaktisk OG semantisk entydighed blandt andet ved brug af RDF (Resource Desription Framework) og OWL ( Web Ontology Language ).
Men før vi tager det skridt, er det vigtigt, at vi finder en fælles forståelse, at vi bliver enige om ,hvad et ord, et begreb eller et tag på en webside betyder.
Vi har brug for en dansk, semantisk wikipedia, der kan vedligeholdes af brugere og anvendes af computere.
1. Hvad er produktet?
Produktet er et dynamisk brugerstyret katalog over sammenhæng mellem begreber og data, samt deres entydige samantiske opmærkning til brug for sammenkædning af data.
2. Hvordan fungerer produktet?
Produktet er et web site opbygget efter samme åbne princip som wikipedia: Alle kan oprette en begrebsdefinition og alle har ret til at blande sig og give en definition eller kommentar.
3. Hvad består produktet af?
Overordnet set består produktet af:

  • Begrebsdefinitioner
  • Ontologier
  • Referencer til kendt anvendelse
  • Videndeling

Begrebsdefinitioner

For alle nedenstående udgaver af begrebsdefinitionen gælder det, at begrebet beskrives i sammenhæng med andre ord og begreber. Beskrives eksempelvis begrebet ’Borger’ vil relationen til andre begreber som ’Vælger’, ’Skatteyder’, ’Statsborger’, ’Person’, ’Patient og så videre, blive inddraget.
Hvert begreb vil kunne optræde i nedenstående udgaver:

  • En bredt accepteret, fyldestgørende beskrivelse i et letforståeligt dansk. Dette er grundlaget for en bred anvendelse og for en minimering af fejltolkninger.
  • Et UML-klassediagram med brug af den udvidede notationsform ODM (Ontology Definition Metamodeling). UML-diagrammerne kan downloades i XMI-formatet og anvendes af udviklere.
  • En XML-beskrivelse af begrebet. Beskrivelsen defineres på basis af XML-repræsentationen af den internationale standard OWL og det til denne udviklede xml-schema.
  • En RDF/XML beskrivelse der opfylder OWL 2 standarden.
  • Optionelt vil en Topic Maps-beskrivelse også kunne gives.
  • Hvert begreb har sin unikke http-baserde URL, der umiddelbart kan anvendes af udviklere og webdesignere  til entydig identifikation.

Ontologier
I takt med opbygningen af dette katalog af entydigt identificerbare begreber vil en række ontologier, eller begrebsmodeller, udkrystalisere sig. Vi vil på denne måde kunne skabe både kerneontologier, der har anvendelse på tværs af faggrænser, samt domænespecifikke ontologier hvis udbytte er størst indenfor enkelte faggrupper.
Et væsentligt plus er, at vi ved denne fremgang kan sikre den tværgående kobling af data uden at skulle nedsætte tunge, langsomt arbejdende udvalg.
Referencer til kendt anvendelse
For at kunne sammenflette data skal man naturligvis have data at flette med. I tilknytning til de enkelte begreber vises en oversigt over kendte, webtilgængelige datakilde, hvor begrebet anvendes.
Videndeling
Viden omkring semantisk opmærkning og anvendelse er en betingelse for at udbrede den semantiske opmærkning og derved for at sikre muligheden for let og hurtig sammenkædning af data. Web sitet bør derfor som en væsentlig del af aktiviteterne have som formål at udbrede viden om semantiske teknologier.
4. Hvilke datakilder skal bruges?
Ved opstarten af kataloget vil de primære datakilder være de personer der i dag har den viden der endnu ikke er udtrykt som semantisk opmærkede data. I takt med katalogets opbygning vil eksterne datakilder i form af ontologier blive tilkoblet og integreret med kataloget.
5. Hvem vil bruge produktet?
Det forventes, at der i vid udstrækning vil være et sammenfald mellem ’nydere og ydere’ af dette begrebs- og datakatalog.
Webdesignere samt web- og dataudviklere vil være de primære brugere af katalogets definitioner, når der skal stilles data til rådighed for kunder, borgere og andre eksterne brugere. Jo mere man ser værdien i kataloget, jo større vil viljen til at levere ny viden til kataloget være. Og omvendt.
Datadefinitioner skal ikke længere udelukkende være et anliggende for en offentlig myndighed eller for en udvalgt gruppe af tekniske eksperter. Alle skal kunne deltage i denne proces. Mange vil kunne give gode definitioner på et klart og letforståeligt dansk, andre vil kunne levere  OWL, RDF og XML-opmærkningen.

[slettet indlaeg]

Hej Stephan

Om din bemærkning:

"I praksis må man nok erkende at de skal kunne have FORSKELLIGE definitioner på samme tid fordi man ikke kan lave en definition som dække området."

Lad os tage udgangspunkt i begrebet 'sag'. Hvis du, jeg, en sagsbehandler i socialforvaltningen, en advokat og et eksemplar af 'manden på gaden', hver for sig skal finde en definition af hvad en sag er, ja så får vi nok en lidt bred definition. Og det er fint og godt og en af grundene til at en åben ontologiopbygning kan give gode resultater. 

Men lad os starte meget simpelt. Vi opbygger en ontologi der i første omgang ikke indeholder andet end en OWL-klasse med et navn, 'Sag', og en URI, 'http://www.oio.dk/basis#sag', der entydigt identificerer begrebet.

Når mit system nu udveksler data med dit system så bruger jeg URI'en til at gøre klart hvad en specifik struktur i mine data handler om. Det er der ikke det store fremskridt i: Vi har principielt den samme entydighed ved brugen af ontologien som vi ville have hvis vi havde refereret til et OIOXML-element.  Men vi kan gøre meget mere her.  Du kan udvide ontologien med en mere specialiseret udgave af 'Sag', eksempelvis en 'Afskedigelsessag', og gøre denne til en delmængde af alle sager ved at gøre den til en SubClassOf 'Sag'. 

På den måde opnår vi altså både at have en entydig definition for en bred definition af et begreb og en eller flere mere specialiserede begrebsdefinitioner.

Vi kan naturligvis også tilføje en række erklæringer om sammenhængen mellem en sag, en sagsbehandler, myndigheder, aktindsigtsret og så videre.  Men lad mig stoppe her og lad mig høre om jeg har forstået dig korrekt og om mit svar kræver yderligere uddybning.

Hilsen

Peter