CIO Tech Eksperten IT-JOB IT-Kurser Events Podcast Søg

Log ind eller opret profil

Du kan også logge ind via nedenstående tjenester

TMorville Nybegynder

28. oktober 2010 - 12:57 Der er 12 kommentarer

Matche direkte adresser med kommuner

Hejsa.

Jeg sidder med et ret irreterende problem. Jeg skal lave en database over nogen avissalg, og helst på kommunebasis.

Mit problem er at hvis jeg prøver at matche postnummer med kommune, får man at de overlapper visse steder. Fx. er Hillerød kommune fordelt på fire forskellige postnumre. Et eksempel kunne være at det samme postnummer findes både i Rudersdal- og Hillerød Kommune.

MEN.. jeg har også de direkte adresser på folk. Det jeg egenligt spørger efter, er en fornuftig måde at matche direkte adresser med kommuner. Er der nogen der har noget liggende?

Jeg har overvejet at lave et vægtet gennemsnit af læsere efter kommune, også fordele læserne efter befolkningsvægte, men det brød min chef sig ikke om.

Anyone?

Vh
Tobias

Synes godt om

mcb2001 Nybegynder

28. oktober 2010 - 13:03 #1

Du kunne jo gribe opgaven an med de data du har, og så lave postnummer vægtede fordelinger, da det ikke er helt enorm hvor stor forskel der er på to personer der bor i henholdsvis postnummer A i rudersdal og postnummer A i hillerød (det er samme fysiske område).

Du kan også få adgang til kort- og matrikkelstyrelsens vejdata. Denne indeholde samtlige 3.5 millioner adresser i danmark, med information omkring kommune, postnummer og lignende. Disse data er dog meget rigide, og svær at arbejde med, da én vej kan være stavet på to forksellige måder alt efter hvilken kommune, postnummer eller landsdel den ligger i, og det er rigtig svær at matche "løs" adresse data op mod dette.

Synes godt om

TMorville Nybegynder

28. oktober 2010 - 13:10 #2

Ja. Problemet (mest min chefs) - er netop at man har X af postnummer A, men postnummer A figurerer i Kommune Y og Z. Hvordan vægter man så dem? Efter befolkningen i kommunerne? Så hvis der bor 3/4 i kommune Y, så fordeler man bare 75 pct. af abonnenterne der?

Den model har jeg diskuteret med min chef, og hun giver ikke meget for det.

Jeg arbejder i SAS, og det bliver garanteret et helvede at bruge INDEX til at matche "nogenlunde" adresser med det rigide data fra matrikkelstyrelsen.

Hvad jeg gerne ville ha'. Var et excelark, hvor eller anden smart person allerede har fordelt postnumre på kommune, med en eller anden god undskyldning/udregning.

Synes godt om

claes57 Ekspert

28. oktober 2010 - 13:36 #3

hverken postnumre eller kommunegrænser er statiske - du bliver nødt til at gå via kort- og matrikkelstyrelsens vejdata.
Ellers skal du ansætte en til at ajourføre regnearket løbende.

Synes godt om

TMorville Nybegynder

28. oktober 2010 - 13:47 #4

Det er OK med et øjebliksbillede, da det skal bruges til en rapport. Men det lyder som om jeg skal have fingrene ned i matrikkelstyrelsens data.

Er det tilgængeligt for alle?

Synes godt om

claes57 Ekspert

28. oktober 2010 - 14:01 #5

du skal 'bare' så lave en match-kode, der skifter aa med å, sct med sankt, fjerner alle bindestreger.
Jeg ville nok starte med at have data uden mellemrum, uden bindestreger, uden punktummer og kun lower case.
fx sctknudsgade11a1903frederiksbergc
idet de sidste 4 cifre er postnummer - de øvrige er husnummer
og så replace aa/å é/e sct/sankt osv
Så er du ude over de fleste fejl/forskelligheder i data.

Synes godt om

mcb2001 Nybegynder

28. oktober 2010 - 14:56 #6

Claes57 - jeg har data liggende, og bruger den til at matche adresser, og tro mig, der er væsentligt mere i den end blot at "skifte" å med aa.

Og jeg holder fast i mit første forslag om at lave statistik på det tilgængelige data du har. Så du fordeler efter postnummer eller fordeler efter alder eller lignende.

Og kort- og matrikelstyrelsens data skal du ansøge om at få adgang til

Synes godt om

arne_v Ekspert

29. oktober 2010 - 03:33 #7

CPR stiller gratis data til rådighed som mapper vejnavn+lige/ulige+startnr&slutnr til postnr og kommune.

Synes godt om

TMorville Nybegynder

15. november 2010 - 14:58 #8

Hej Arne_v - hvor kan jeg finde dette?

Jeg har ledt på deres side, og det jeg får ud ved vejregisteret ser meget underligt ud.

vh

Synes godt om

arne_v Ekspert

15. november 2010 - 23:42 #9

http://www.cpr.dk/cpr_artikler/Files/Fil2/4354.txt

Synes godt om

arne_v Ekspert

19. november 2010 - 23:54 #10

Og mit program er lavet fordi alle ikke programmerer i COBOL.

Synes godt om

mcb2001 Nybegynder

20. november 2010 - 06:05 #11

?????

Synes godt om

arne_v Ekspert

20. november 2010 - 14:08 #12

Formatet på filen i linket er hvad jeg vil kalde typisk COBOL format.

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Database management kurser

Computerworld tilbyder specialiserede kurser i database-management

Se alle Database management kurser

Flere spørgsmål fra Andre databaser kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Kasserapporten Af Bjørn i Andre databaser	5	15/08/202318:05	19/08/202309:40
Project 13 Produkt nøgle Af per2edb i Andre databaser	8	13/09/202214:20	14/09/202211:20
Sådan finder du radiokoden til min Skoda-radio Af berbailey i Andre databaser	3	01/11/202116:42	02/11/202113:25
progra til at lave en database på nette med web interface Af TheBonden i Andre databaser	1	17/07/202116:54	19/07/202112:13
USPS til Danmark Af Clara Thrane i Andre databaser	1	23/03/202115:21	23/03/202115:41

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS