Loading…
Tilbage

Profilbillede

SAWA vs Google

Peter Kusk

Hej,

Jeg har brug for hjælp til at fortælle en leverandør af et system, at det er bedre at bruge DAWA til adresse- og koordinat-opslag, end Google.

Min opfattelse er, at DAWA baserer sig på officielle registreringer - det i kalder autoritative data -, og at opdatering sker systematisk og baseret på såvel lovgivning som tilhørende bekendtgørelser.

Det trænger ikke igennem, bl.a. påstås det, at adresser der komer fra cpr-registret ikke giver rigtige opslag.

Kan I henvise til god og præcis beskrivelse af sammenhængen mellem adresser i cpr- og dawa-registrene, så jeg kan få lukket den snak ?

På forhånd tak.

Hej Peter

DAWA's adressedata stammer fra Danmarks Adresseregister (DAR), som rummer de autoritative adressedata. Som du skriver er de reguleret af adresseloven samt adressebekendtgørelsen

Det er de kommunale adressemyndighederne, som har ansvaret for at opdatere adressedata i DAR. Der går mindre end to minutter fra en kommunal adressemedarbejder har opdateret en adresse til den er udstillet på DAWA. For at få en fornemmelse af de daglige opdateringer af adressedata i DAR, kan du indenfor normal arbejdstid se aktiviteten på http://ajour.aws.dk.

CPR anvender adressedata fra DAR. Offentlige systemer skal ved nyudvikling anvende adressedata fra DAR. Der er i dag ca. 5000 it-systemer, som anvender adressedata fra DAR via DAWA. Fra store offentlige systemer til små webshops.

Google har ikke i samme grad som DAR opdaterede adressedata. Derudover kan man i Google slå adresser op som ikke eksisterer.

Hvis man ønsker opdaterede, autoritative adressedata i høj kvalitet er det en rigtig god ide at anvende DAWA.

Mvh.
Finn

Hej Peter

Data i CVR og DAWA er de "officielle og korrekte" data. Vi har som leverandør af vores produkt (360 Business Tool) valgt både at understøtte DAWA og Google. Vi bruger DAWA som default, og "falder over på" Google hvis DAWA ikke returnerer et svar, eller hvis brugeren mener at svaret ikke er "godt nok"

"Problemet" som din leverandør formentlig prøver at påpege, er at en del 23virksomheder måske "glemmer" at opdatere deres adresse i CVR, eller at adressen i CVR er postadressen, men at besøgsadressen er en andet. Da samme virksomheder formenlig selv opdateret deres info i Google - kan Google således giver "bedre adrressedata". Mine erfaringer er dog at det er meget sjællent.

Vores erfaringer er at den "tekniske kvalitet" af DAWA er super god, men data bliver jo aldrig bedre end hvad der kommer fra kilden.

Jeg vil foreslå dig:

1) at få din leverandør til at levere et antal eksempler hvor data i CVR er forkerte og hvor Google giver den korrekte adresse.

2) Gøre opmærksom på at DAWA er gratis og at Google koster penge

 

 

Hej Peter

Du skal helt sikkert holde fast i DAWA. Google Maps leverer en hel del fejl, fordi de ikke anvender autoritative adresser. Googles adresser bliver ikke rettet, selv om man gør dem opmærksomme på det.

I Hvidovre har vi for halvandet år siden tildelt Enghøjhuset adresserne Bødkerporten 1A til 1Y. Den tidligere adresse Bødkerporten 1 hedder i dag Bødkerporten 3A. 3A adresse ligger på den anden side af en sti, der løber på dæmning i første sals højde. Det er således ikke umiddelbart til at se fra Enghøjhuset med husnumrene 1A-1Y til nr. 3A.

Kommunens institutioner i Enghøjhuset, ikke mindst Ungeporten, oplever, at borgere kommer og skælder dem ud for at have forkert adresse, fordi de har søgt efter Bødkerporten 1F på Google. Denne adresse kender Google ikke og henviser derfor til, at Bødkerporten 1 (husnummer 1 uden bogstav findes ikke længere) ligger på den tidligere placering, som altså i dag er 3A.

Af samme grund har jeg tre eller fire gange været inde på Google og angive den korrekte placering for Bødkerporten 1F, som er Ungeportens adresse, men i løbet af kort tid er mine rettelser væk igen.

Her er et klokkeklart eksempel på, at Google direkte giver forkert vejvisning, fordi de benytter forældede adresser.

Du kan formentlig finde en hel del virksomhedsadresser i CVR, som du ikke kan genfinde i DAWA. Min erfaring fra København og Hvidovre siger mig, at det kun er ca. 60 pct. af adresserne i CVR, som kan findes i DAWA. Uden at have testet det, vil jeg imidlertid tro, at der også er en del, som ikke findes hos Google. Det opdager man bare ikke, da Google interpolerer, hvis den ikke kender den konkrete adresse, som der søges på. Det kan imidlertid også give nogle temmeligt misvisende vejledninger.

Min personlige rekord er en fejlvisning i Google på 3-4 kilometer. Det er godt nok i Norge, men i betragtning af, at det er i et område, hvor de nydannede husnumre er baseret på vejkilometrering, er det ret imponerende at ramme så meget ved siden af.

Min generelle konklusion er derfor, at Google Maps skal bruges med forsigtighed, da der er mange fejl.

I øvrigt er CVR begyndt at bruge autoritative adresser til nyoprettede virksomheder, men de eksisterende er endnu ikke rettet til. Det skulle, så vidt jeg husker, ske i første halvår af 2019.

Vh Lars

Hej Finn, Henrik og Lars,

1000 tak for Jeres svar, de er særdeles brugbare.

Dejligt at få svar fra rigtige brugere, der kender systemet.

/Peter

Definitely Dawa has the better data, the only downside I can see in comparison to Google - is if you provide free text search based on Dawa for users who might not know how to spell the address they are looking for the Dawa addresses, as far as I can discern, are not stemmed or decompounded, as a result the behavior of autocomplete, results returned and a few other things can be off from what you might expect.

I have considered setting up a replication pipeline for DAWA that will then save it into an ElasticSearch index, and then allow others to replicate that via elasticdump but not sure it can be made worth the time (what with having obligations and such)

This concern might also be a reason to do as Henrik discussed, falling back to Google if one cannot find the answer in the authoritative DAWA results. 

 

Hi Bryan,

Thank you for your feedback.

Could you elaborate a bit on how results from DAWA autocomplete can be off from what you might expect? Perhaps a couple of examples of search strings that does not give you the expected result?

 

Hi Anders, I can't really come with examples anymore, I just experienced them when making the Driftsinformation SPA for YouSee, I had put it down to the data not being stemmed and decompounded and didn't think anymore about it.

Was I wrong? This was also approximately 6-9 months ago.

I just went and looked at the Autocomplete on Dawa and it looks like maybe it is stemming since Højt or Højer tastrup still returns Høj Taastrup although that could also probably be handled by a good levenshtein distance implementation somewhere?

I can ask the tester at YouSee if she has any address searches that she thinks should return something else in autocomplete but it doesn't. 

Hi Bryan,

DAWA autocomplete is based on PostgresSQL text search. We do not do stemming, but we do some accent normalization and we also have an explicit synonym list (https://github.com/DanmarksAdresser/Dawa/blob/master/packages/server/psql/dictionaries/adresser_xsyn.rules).

If fuzzy searching is enabled using the fuzzy parameter, we additionally do approximate search using trigrams, where the results are ranked using levenshtein distance.

We are very interested in examples of search strings which do not return the expected results.

Hey Anders, 

I will try to get some examples. 

 

Mvh,

Bryan Rasmussen