Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 4. oktober 2002.
Danmark er nu officielt opdelt i kvadrater. Når kvadraterne kombineres med oplysninger fra offentlige myndigheder, kan data mining give nye muligheder for at analysere en lang række faktorer.
Marketing, baseret på geografiske informationssystemer har aldrig fået det forventede gennembrud herhjemme. Nu er der åbnet nye muligheder for at lave mikro-geografiske analyser af en lang række data, der fortæller meget om danskernes gøren og laden.
Vi er kommet meget tættere på. Vi er gået fra makro- til mikroniveau. Jeg vil påstå, at det her er et stort skridt fremad for data mining i forbindelse med geomarketing, siger administrerende direktør Martin Glarvig fra firmaet Geomatic.
Firmaet er blandt de første kommercielle brugere af de nye muligheder, som er åbnet med frigivelsen af geografiske koordinater på alle danske adresser kombineret med det nye såkaldte Danske Kvadratnet. Kombinationen gør det muligt at stedfæste data meget mere præcist, end det hidtil har været muligt.
Bag kvadratnettet ligger et flerårigt projekt gennemført af Danmarks Statistik, Kort- og Matrikelstyrelsen, Danmarks Miljøundersøgelser og Sundhedsstyrelsen.
Informationer som oplysninger fra offentlige registre som for eksempel matrikelkort og -register, Bygnings og Boligregistret (BBR), CPR-registret, den offentlige ejendomsvurdering og det centrale virksomhedsregister (CVR) samt en lang række oplysninger kan nu stedfæstes præcist til en adresse.
Analyserne må ikke bryde med de diskretionsprincipper, der er udstukket af Danmarks Statistik for information, der kan henføres til enkeltpersoner. Derfor leveres de offentlige data aggregeret, hvilket vil sige, at de ikke kan henføres til enkeltpersoner.
100 x 100 meter
Kvadratnettet gør det muligt at samle et antal adresser inden for celler på ned til 100 x 100 meter. Derefter kan cellerne analyseres med data mining-værktøjer.
Geomatic har i samarbejde med Danmarks Statistik udviklet geomarketing-systemet conzoom. Med anvendelse af forskellig statistisk information og kvadratnettet har firmaet dannet statistik i klynger, der udgøres af henholdsvis 20, 50, 100 og 150 husstande.
Klyngerne er dannet ved at beskrive de enkelte celler i kvadratnettet demografisk og derefter sammenlægge de mest signifikante celler indtil antallet af husstande er til stede.
Præcise analyser
- Celleanalyse er langtfra en ny disciplin, men det har ikke tidligere været muligt at lave tilnærmelsesvis så præcise analyser som nu. Vores basismateriale er omtrent på højde med manuelt indsamlede data, og vi vil bruge det til at videreudvikle celleanalyse til markedsføringsformål, forklarer Martin Glarvig:
- De nye værktøjer kan både anvendes af forskere og samtidig være nyttige for resten af samfundet, tilføjer han.
GIS i birolle
I modsætning til mange af de forsøg på at udvikle geomarketing-disciplinen i Danmark spiller geografiske informationssystemer (GIS) ikke en hovedrolle i Conzoom. Analyse af data fra Conzoom foretages med data mining-værktøjer som for eksempel SAS eller SPSS, mens GIS primært anvendes, hvis der er behov for at visualisere analyseresultaterne.
Conzoom består i dag af 2,2 millioner husstande, en halv million celler og 70.000 klynger af 20 husstande samt et GIS-system. Systemet er opbygget af relationstabeller med unikke adressenøgler og er parat til at blive importeret til relationsdatabaser.
Billedtekst:
Visualiseringen viser en cellebaseret analyse af indkomstfordelingen i et område nord for København. Jo mørkere farve, desto højere andel af husstande med bruttoindkomst på over 450.000 kroner.
Visualisering: Geomatic