Loading…
Tilbage

Ugerapport 1


23-07-2012 16:49:04

En kort oversigt over hvad der er lavet indtil nu. Jeg vil forsøge at lave en sådan rapport hver uge.

Har lavet en regelgruppe for leje←→lege,der fanger at lege en bil mod at lege en leg/leje en bil. Der har været problemer i testene når jeg f.eks. har brugt substantiver i bestemt form, som "Vi lejer i legehuset". Dog ingen problemer med sætningen "Vi lejer i legehus", som den fanger helt korrekt.
Har haft problemer med, at substantivers (bl.a.) flertalsformer ikke fanges. Dette skal undersøges nærmere.
Har lavet et simpelt udkast til en kommaregel ved sætninger med "men", men der er to tidspunkter et komma er valgfrit før "men", som ikke fanges. Dette kræver en større analyse af en sætning, så reglen er slået fra som default.
Derudover har jeg tilføjet en del forkortelser: fkr.→f.kr., fkr→f.kr., b.la.→bl.a., bla.→bl.a., BC.→BC, AD.→AD., incl.→inkl., excl.→ekskl. Der er pt. et problem med, at jeg ikke kan negere et punktum (og derved fange alle andre tilfælde, end når der står et punktum). Dette gør bl.a. at jeg ikke kan fange f.eks.: A.D→A.D. Jeg skal spørge om dette på mailinglisten til LibreOffice.
Rettede dobbeltordsreglen til at håndtere apostrof ('), som ved sætninger som "En om'er er besværlig.", som den ellers lavede falsk positiv på.
Nogle tal-sammensatte ord som 30-års-krigen eller 70-årig bliver fanget.
Jeg har testet alle reglerne i et korpus, jeg samlede baseret på artikler på nyhedssider som Berlingske Tidende, Information, Politiken og fra artikler fra wikipedia om bl.a. matematik og filosofi. Derudover er kopuset suppleret med mine egne rapporter o. lig. fra mit studium.
Jeg har opdateret LanguageTools wikipedia (https://wiki.documentfoundation.org/DA/LanguageTool/) med afsnit, i forbindelse med regler fra den implementerede grammatik, og som vil blive linket til i LibreOffice.

Du efterlyser faste fejl, så jeg iler med en, inspireret af din tekst: En om'er staves: ommer. Se sprognævnets artikel om det.

Om man kan ophøje det til en generel regel ved jeg ikke, det vil jeg lade eksperterne om!

Ah godt set. Jeg er generelt gået ud fra sprognævnets artikler, men har tydeligvis misset hvordan en "ommer" staves. Princippet (med dobbelt-ord) holder heldigvis stadig, men jeg ændre lige eksemplet og tilføjer en regel om om'er->ommer. Tak for input.

Der er også mange artikler at holde styr på fra sprognævnet.

I forhold til princippet, om dobbelt ord, er der nogle spændende udfordringer, f.eks. "Kommer I i morgen", som naturligvis kun er et problem, hvis man ikke sammenligner casesensitivt, men bliver et større problem, jo flere, der ikke ved at I staves med stort.

Et andet tilfælde, som jeg tænker er sværere at tage højde for: "Først så han på hendes fødder, så så han på hendes ansigt."

Kan det løses?

"Så så han..." bliver håndteret (reglen er originalt ikke skrevet af mig), da reglen fungere ved at matche et ord med det efterfølgende, og med mindre ordet er en del af en undtagelsesliste (hvor så er med), bliver der markeret fejl ved gentagelser. Dette kan muligvis laves pænere, når der engang kommer en god tagger til at analysere alle ordene, men denne er ikke helt god endnu.

Mht. I og i er denne ikke på undtagelseslisten endnu, men jeg tilføjer den nok. Jeg laver den, så den er case-sensetiv. Men ja, der er mange der staver I (som en folkemængde) med lille (inkl. mig selv nu og da).. Dette kan muligvis også fanges, hvis taggeren har verbummer, men denne del er ikke helt up-to-date endnu.

Det er sjovt som sproglige spørgsmål kan få folk op af (eller ad?) stolene. Her på Magentas kontor mærker vi i disse dage tydeligt de forskellige "generationer". Der er jævnligt diskussion om hvordan sproget egentlig er.

Henrik har allerede finpudset mange af de eksisterende regler og lavet helt nye regler. Noget af det er dokumenteret her: https://wiki.documentfoundation.org/DA/LanguageTool/Regler (opdateres løbende).

Vi er stødt ind i et overordnet problem: Hvem er autoriteten?

Sprognævnet er i princippet den øverste myndighed, men skal vi altid rette ind efter dem?

Hvad skal vi gør,e når vi er enige om at Sprognævnet tager fejl?

Hvad synes du?

Som jeg ser det, er det sprognævnet der er øverste myndighed. Selv om de sommetider opfører sig mærkeligt (hvem sagde majonæse?)

Jeg er selv stor sprogelsker og oplever at ofte så er det du omtaler som fejl fra sprognævnet, udtryk for forskellige personers personlige præferencer.

Har I nogle konkrete eksempler på fejl?

Op af stolene må det være. Mht. Ad og af er der en sjov artikel/test på http://sproget.dk/leg-og-ler/quizzer-og-ovelser/ad-eller-af

I øvrigt kan jeg anbefale at ringe til sprogtelefonen, hvis I er uenige eller i tvivl. Der sidder meget engagerede sprogentusiatser og besvarer den.

Sidst jeg havde fat i den, var det for at opklare retskrivningsregler for gruppesammensætninger med engelske begreber, nærmere bestemt open source: Open source-projekt, open source-licens, og open source-licens-vilkår for at nævne et par stykker.

Det har vi faktisk også været ved at gøre flere gange, men er indtil videre blevet enige før vi ringede. Men det er helt sikkert løsningen, hvis vi kommer ud i uenigheder eller ukendte områder.