03. januar 2002 - 12:48Der er
7 kommentarer og 1 løsning
Program til at finde redundans Data
Jeg har en database som er fyldt med Data som ens. Jeg skal have fjernet alle de poster som oprettet for den samme person.
Jeg bruger tlfnr som kundenr. Når en person skifter tlfnr bliver personen oprettet igen i databasen, fordi man ikke kan finde personen med det nye tflnr i databasen.
Der ligger mange poster, så jeg vil gerne lave et program som rydder op i databasen. Databsen er for stor til at begynde at ryde op mauelt.
Hvilket programmeringssprog vil bedst til at løse sådan en opgave? Jeg har kun kendskab til c++, java og JSP, som muligvis kan bruges.
Er der nogen som kan give mig nogle råd eller noget kode som jeg kan begynde at arbejde med? eller hvis der er nogen der har lavet noget lignende.
Det jeg har tænkt på var at bruge navn og adresse til at finde de poster som er ens. men lige hvordan jeg skal gribe denne opgave and er ikke helt....
Ok, jeg vil så anbefale at bruge SOUNDEX-algoritmen (indbygget som funktion i f.eks. MySQL) til at se hvilke navne og adresser, der lyder ens, uanset stavemåde, og så sammen med byen afgøre hvilke der er kandidater til at være ens. De stilles så op, så du manuelt kan sige ja eller nej til dem.
Du behøver sådan set ikke programere noget. Bare køre det som ren SQL syntax. Men, har du en timestamp eller lignende der viser hvilket tlf. nummer er det nyeste? Hvis ikke, kan du slet ikke begynde at rydde op, da du ikke ved hvilket tlf. nummer er gyldig.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.