Dataklassificering - ILM's svære kunst

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den CTO d. 1. september 2006.


ILM: Information Lifecycle Management (ILM). Virksomhedens effektive håndtering af data drejer sig ikke blot om et simpelt valg af en teknologisk løsning for, hvordan de skal lagres. ILM handler i høj grad om analyse og prioritering: Hvordan flytter man på bedste måde data mellem lagringsmedier med forskellige hastigheder baseret på, hvor stor værdi data har for ejeren på forskellige tidspunkter.

struktur Klassificering af data er en af de vigtigste discipliner i ILM-arbejdet. Nye teknologier lover at automatisere arbejdet.

It-afdelinger står over for en ny opgave: Klassificering af den store mængde ustrukturerede data, som ligger spredt omkring på virksomhedens servere og arbejdsstationer. Det er nødvendigt, hvis virksomheden ønsker at have styr på sine data og være sikker på, at data opbevares på den bedste, billigste og sikreste måde. Typen af data afgør, hvor tit der skal tages backup, hvilket storagemedie der skal anvendes, og hvordan data skal sikres. Klassificeringen af data er del af en ILM-proces.
- Det er et kæmpeområde at klassificere data. De fleste virksomheder er klar over det. Det er ikke alle, der er i gang, men der er stor forståelse for området, siger Bjarne Madsen - HP, nordisk formand for storage-
organisationen SNIA (Storage Networking Industry Association).
Et ILM-projekt starter typisk med en analyse af virksomhedens data. Formålet er blandt andet at klassificere data ud fra, hvor ofte de anvendes, og hvor vigtige de er for forretningen. Det har betydning for, hvordan data skal håndteres, og hvilke storage-enheder som data skal gemmes på.
- De fleste ved godt, hvad de har liggende af data, men de har ikke nødvendigvis klassificeret dem. Klassifikationen kan ske ud fra mange parametre. Eksempelvis hvornår data sidst er blevet læst, og hvornår de sidst er blevet ændret. Her viser det sig ofte, at det kun er 20 procent af data, der er blevet ændret det sidste år. De resterende 80 procent er ikke blevet ændret, men de er stadig del af den daglige backup. Her kan en klassifikation baseret på historik være med til at ændre backup-procedurerne, så man kun tager backup af de ændrede data, siger Bjarne Madsen.
Datahistorik er en klassificeringsmetode. En anden metode er at se på den forretningsmæssige betydning af data. Endelig kan man også klassificere data udfra, om der er lovgivningsmæssige krav knyttet til data.
- En anden parameter, man klassificerer data efter, er indholdet, betydningen af data. Det er vigtigt at vide, hvilken slags data der er tale om. Det kan eksempelvis være patientdata på et hospital. Den slags data skal behandles med en hvis konfidentialitet. På den måde spiller datasikkerhed også ind i dataklassifikationen, siger Bjarne Madsen.

Der findes i dag værktøjer, der kan være med til at bestemme historikken for ustrukturerede data. Men også vurderingen af datas forretningsmæssige betydning kan man få hjælp til. Det sker ved hjælp af Intelligent Information Management (IIM) eller Intelligent Classification Management (ICM), som det også kaldes. Det er firmaer som Kazeon, Njini, Trusted Edge, StoredIQ og Index Engines, som lover at lette klassificeringsarbejdet.
Nogle af løsningerne danner et fuldt tekstindeks på baggrund af indholdet af en fil. Andre løsninger søger filer igennem for bestemte ord eller sætninger og klassificerer dem ud fra brugerbestemte regler. Løsningerne kan blandt andet anvendes til at markere filer, der indeholder konfidentielle oplysninger.
Ifølge Bjarne Madsen er det endnu ikke noget, som anvendes i stor stil blandt SNIA's medlemmer.
- Jeg har ikke kendskab til, at der er meget af den slags i produktion. Det er ikke noget, vi har diskuteret indgående i SNIA, siger Bjarne Madsen, der umiddelbart er lidt afventende over for værktøjerne.
- Jeg tror ikke, man undgår at have et menneske ind over og vurdere datas forretningsmæssige betydning.

Analytikeren Claus Egge fra IDC er mere begejstret for IIM.
- IIM vil være en stor hjælp, hvis det kan blive en del af ILM, siger Claus Egge, der spår at IIM/ICM-markedet med tiden vil blive stort.
- Det bliver stort, men det tager tid. Før det bliver mainstream, skal nogle af de store gå ind i det, siger Claus Egge, der nævner, at Njinis produkt allerede anvendes af nogle engelske selskaber.
Det ser da også ud til, at de store storageleverandører vil tage IIM/ICM-konceptet til sig. Storagegiganten EMC har meldt ud, at de vil lancere et IIM/ICM-produkt i løbet af dette halvår.

Faktaboks:

NASA kunne lære af ILM
ILM går også ud på, at man sikrer sine langtidsarkiverede data. Her kunne den amerikanske rumfartsorganisation NASA givetvis have haft fordel af en ILM-
proces.

Apollo 11´s månelanding blev transmitteret som højkvalitets Slow-Scan TV (SSTV) fra Månen. SSTV-signalerne blev optaget på magnetbånd, samtidig med at SSTV-signalerne blev konverteret til tv-signaler af ringere kvalitet og derefter sendt ud til verden. I maj 2006 afslørede en rapport, at 698 af i alt 700 SSTV-magnetbånd fra Apollo-æraen var forsvundet. Ydermere er det kun Data Evaluation Lab på Goddard Space Flight Center nær Washington DC, der har udstyr til at afspille magnetbåndene. Det er planlagt, at Data Evaluation Lab skal lukkes næste måned.
XAM
eXtensible Access Method er en ny standard under udarbejdelse, der skal gøre forbindelsen mellem applikationslag og storagelag enklere. I oktober 2004 startede IBM, HP, EMC, Hitachi og Sun et samarbejde for at specificere standardgrænseflader mellem applikationslag og storage-lag. I juni måned i år overdrog konsortiet af it-leverandører standarden til SNIA. SNIA er i gang med at lave review på den foreslåede standard.

OriginalModTime: 14-09-2006 10:18:38




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Despec Denmark A/S
Distributør af forbrugsstoffer, printere, it-tilbehør, mobility-tilbehør, ergonomiske produkter, kontor-maskiner og -tilbehør.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Industry 4.0 – sådan udnytter du AI og digitalisering til optimering af din produktion.

På denne konference fokuserer på en digitaliseret optimering af processer i produktions- og procesorienterede virksomheder. Herved bliver du f.eks. i stand til at kombinere maskiner med sales forecasting og derved planlægge anvendelsen af produktionsapparat og medarbejderallokering effektivt – samt begrænse materialespild og nedetid ved at optimere produktionsplanlægning og omstilling af produktionsmateriel.

04. september 2024 | Læs mere


Roundtable for sikkerhedsansvarlige: Hvordan opnår man en robust sikkerhedsposition?

For mange virksomheder har Zero Trust og dets principper transformeret traditionelle tilgange til netværkssikkerhed, hvilket har gjort det muligt for organisationer at opnå hidtil usete niveauer af detaljeret kontrol over deres brugere, enheder og netværk - men hvordan implementerer man bedst Zero Trust-arkitekturer i et enterprise set up? Og hvordan muliggør Zero Trust-arkitekturen, at organisationer opnår produktivitetsfordele med AI-værktøjer samtidig med, at de forbliver sikre i lyset af fremvoksende trusler?

18. september 2024 | Læs mere


Nye forretningsmæssige gevinster med Microsoft Dynamics 365

Eksperter fra CGI stiller skarpt på hvordan, du lærer også hvorfor det er vigtigt at have fokus på både processer, teknologi og mennesker - og hvordan du kommer i gang med løbende optimering af forretningsudvikling.

25. september 2024 | Læs mere