15. oktober 2007 - 09:37Der er
4 kommentarer og 1 løsning
Anonymisering af CPR-numre
Hej eksperter
Jeg skal i et SAS data set erstatte alle CPR-numre med en nøgle, således at jeg kan aflevere settet til en database i anonymiseret form. Følgende krav skal opfyldes: - samme CPR skal give samme nøgle hver gang, og nøglen skal være entydig - det skal være muligt at gå fra nøglen til CPR-nummeret, men kun for mig (dvs. en slags kryptering hvor kun jeg kender nøglen)
Hvordan vil I foreslå at jeg gør dette? Det skal kodes i base SAS, men løsninger fra andre sprog modtages også gerne, da jeg forestiller mig at det kan oversættes.
Det optimale ville være, hvis man kunne lave noget smart, sådan at man kunne lave 2 makroer - een til at anonymisere CPR, og een til at oversætte en nøgle tilbage til et CPR-nummer.
Hvorfor ikke blot oprette en database-tabel med 2 felter:
1) Et auto-increment felt. 2) Et felt til CPR-nummeret.
Så starter du med at lave et array med de CPR-numre der skal i tabellen. Dette laver du en randomifisering på sådan at de f.eks. ikke står ordnet efter år.
Derefter lægger du CPR-nummeren i tabellen et efter et. Det auto-incremenerende felt tæller 1 op ad gangen.
Derefter bruger du værdien i auto-feltet som stedfortræder til CPR-nummeret. Desuden udlevere du selvfølgelig ikke basen med denne tabel, men beholder den for sig selv.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.