Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den Computerworld d. 2. juli 2004.
It-afdelingerne kæmper med eksplosion i datamængderne og øgede lovkrav om arkivering. Et mylder af it-selskaber kæmper om storagemarkedet.
Firmaer som IBM, EMC, Hewlett-Packard og flere andre har de store ord og de store budgetter fremme for at markedsføre et begreb, der ikke er helt nyt, men som lovindgreb har gjort særdeles aktuelt.
Det gælder Information Life-cycle Management. Begrebet omfatter styring af informationslagring fra datas "fødsel" til "død" ud fra forud fastlagte politikker. Disse vil afspejle, hvor kritiske de forskellige typer informationer er for forretningen.
Det er ikke blot som i gamle dage bogføringstransaktioner, der betragtes som kritiske. Også de ustrukturerede data. E-mails med og uden bilag skal opbevares, og alene den stigende mængde mails, der præsenteres i USA's retssale som dokumentation i retssager, taler deres eget sprog om behovet.
Lagring af tekstbehandlingsdokumenter, regneark, tekniske 3D-modeller og mange andre datatyper skal underlægges politikstyret lagring. Oven i kommer de enorme mængder af spor fra internetbrugen.
Lagringsfirmaet EMC skønner, at mængden af data stiger med hele 60 procent årligt. Analysefirmaet IDC har et mere beskedent, men stadigt højt gæt, nemlig 40 procent, men det er stort nok til at sætte it-afdelingerne under pres, mener IDC.
Flade budgetter
- Vi har været vant til at se stigende budget og mandskab på lagringsområdet, men nu er budgettet flat. Om to år skal it-afdelingerne håndtere dobbelt så meget, men med samme ressourcer, så der skal bedre værktøjer til, sagde Bill North, der hos IDC har ansvaret for analyser på storage-software, da han i sidste måned talte på et EMC-arrangement for journalister.
Specielt i USA har lovgivning og regler udløst et kraftigt behov for at få styr på opbevaring af data over længere tid og sikring af, at ingen efterfølgende kan manipulerer med de arkiverede historiske data. Mest omfattende rammer Sarbanes-Oxley-loven fra 2002, der fulgte i kølvandet på storstilet regnskabsfusk hos Enron. Loven indebærer blandt andet, at regnskabsdata skal opbevares syv år mod tidligere fem år.
Fra det amerikanske børstilsyn, SEC, (Stock Exchange Commission) stilles krav om, at visse data skal lagres på medier, der kun kan skrives på én gang, og derefter kun læses - de såkaldte Worm-medier (write-once, read many).
Informationskæden i medicinalindustrien og sundhedssektoren blev taget under behandling i loven HIPAA (Heath Insurance Portability and Accountability Act of 1996). Loven stiller vide krav, lige fra lagring af alle data om medicinforsøg til lagring af røntgenbilleder - i visse tilfælde så længe patienten lever.
Sporing af terrorismeplaner
Terrorangrebet på World Trade Center gav også ekstra fokus på overvågning af data som en af mange metoder til at bekæmpe terrorismen. Her er Danmark og flere andre lande også kommet på banen. Internetudbydere skal nu sikre overbevaring af data om trafikken på nettet over en længere periode.
Men også de rent amerikanske love slår igennem herhjemme. De største danske medicinalfirmaer har store leverancer til det amerikanske marked og skal derfor overholde HIPAA-loven. Enron-følgelovgivningen rammer danske børsnoterede firmaer med datterselskaber i USA.
Alle disse ting tilsammen er medvirkende til den kraftige vækst i registreringen af informationer, og ifølge IDC's Bill North ville it-afdelingerne have været endnu mere ilde stedt, hvis ikke den teknologiske udvikling havde medført et næsten lige så stort procentmæssigt fald i prisen på datalagring som væksten i datamængderne.
Der kan være store penge at spare på at afveje datas vigtighed for forretningen med, hvad det koster at lagre på de forskellige medier. Informationer er typisk mest kritiske for forretningen eller organisationen, lige når de er skabt og en kort periode derefter. Så falder værdien af data, og dermed behovet for lynhurtigt at få adgang til dem.
Sygehuse udgør et klassisk eksempel herpå. Når patienten indlægges, er der høj aktivitet på patientjournalen under indlæggelsen, og derefter toner det af. Først hvis patienten indlægges igen, bliver det afgørende igen at have hurtig adgang til journalen.
Urørte data
Ifølge analysefirmaet Gartner røres 70 procent af alle data på disk ikke, efter at der er gået 90 dage, og det er penge ud af vinduet, hvis man beholder disse data på de hurtigste disk.
Information Life-cycle Management (ILM) handler derfor også om en sammenkobling af styringen af indhold - Content Management - og styringen af lagring. Optimalt skal ét og samme styringssystem pr. automatik flytte data et trin ned i lagringsmedie-hierarkiet - altså til et billigere medie - for hver gang data overskrider de tidsmæssige grænser, der er sat for graden af den pågældende type datas vigtighed for forretningen.
Utility computing
It-afdelingernes interesse i ILM skal imidlertid også ses på baggrund af den nye betalingsform, som it-leverandører indfører - den, der kort fortalt går ud på, at kunden kun skal betale for den computerkraft, den netbelastning og den lagringsbelastning, der vitterligt bruges.
Begrebet har mange navne - heriblandt utility computing, computing on demand og adaptive computing. Den nye afregningsform, der typisk betyder, at it-leverandøren også overtager driftsopgaven, sælges på, at it-afdelinger i dag belastes hårdt økonomisk af at skulle have en kapacitet, der kan håndtere spidsbelastning, uanset om denne måske kun indtræder to gange årligt.
Ved forhandlingen med leverandøren gør it-afdelingen imidlertid klogt i også at være godt inde i ILM-tankegangen. Det kan sikre, at den tilbudte it-arkitektur også afspejler det nøjagtige behov for billige lagringsformer.
Boks:
Information Life-cycle Management på et hospital
Data om patienter er vigtigst i perioden op til behandlingen/operationen. Derfor skal de ligge på lynhurtige lagermedier. Efter behandlingen falder kravet til hurtighed, og data kan flyttes over på langsommere - og billigere - lagermedier. Bliver patienten atter indlagt, flyttes data tilbage til hurtige medier.
1) Patient indlægges på hospitalet
2) Patientens data og historie registreres
3) Diagnose og prøver
4) Operation
5) Overvågning
6) Efterfølgende pleje
7) Patienten udskrives
8) Opfølgende lægekonsultation
9) Patientjournalen arkiveres på billige lagermedier
Boks:
Datalagringens hierarki
Har virksomheden store mængder data, bør de vurderes efter relevans og behov for tilgængelighed. Ud fra denne vurdering flyttes data op og ned datalagringens hierarki.
Lag 1: På det øverste - dyreste - lag finder man kraftige, selvstændige diskbaserede lagringssystemer. Data kommer typisk fra driftsystemernes store databaser.
Lag 2: Lidt billigere lagringssystemer. Bruges typisk til lagring af breve og andre tekster samt regneark.
Lag 3: Her ses de langt billigere standarddiske ATA (Advanced Technology Attachment). De bruges typisk til data, der skal være til rådighed, men ikke bruges hyppigt.
Lag 4: Den billigste lagringsform er tapebaseret. Tape er den sidste endestation før "døden" i form af sletning for data.
Lag 5: Her er tapekassen lagt i en arkivkasse på et fjernlager.
Pris: Hvis der er lovmæssige krav om, at data ikke må kunne manipuleres, vil lagringen finde sted på såkaldte Worm-medier (write-once, read many). Prisniveauet afspejler hierarkiet. Ifølge europæiske tal fra analysefirmaet IDC koster det knap en krone pr. megabyte (16 cent) at lagre en megabyte data på lag 1. På ATA-laget er prisen faldet til omkring en tredjedel.
Noter:
Tape til "Worm"
IBM lancerede for nylig sit første tapeprodukt af typen, der lever op til lovgivningsmæssige krav om "skriv én gang, læs mange gange" - altså produkter, hvor der ikke kan manipuleres med de registrede data. Produkttypen kaldes Worm (write-once, read many) - en betegnelse, der oprindeligt blev brugt om optiske diske.
IBM's produkt er en tapekassette, der sikrer mod ændring af data. Den kan bruges i de eksisterende IBM 3494 og 3584 tapesystemer. Kassetten rummer blandt andet en lille radiosenderchip, som kan bruges til at spore, hvornår tapen er brugt og af hvem. Kassetten findes i to version - en til 60 gigabyte med en svartid på 11 sekunder, og en til 300 gigabyte med en svartid på 39 sekunder. toft
ILM hos KMD
KMD - det tidligere Kommunedata - hører blandt de danske virksomheder, der er længst fremme med satsningen på Information Life-cycle Management, oplyser Niels Astor, EMC-salgsdirektør for det danske og det norske marked.
EMC og KMD har indgået et samarbejde, der blandt andet skal resultere i udviklingen af en række forskellige lagringsløsninger til kommunerne - løsninger, der afspejler økonomi og behov. KMD har i øvrigt som en af landets første virksomheder anskaffet sig EMC's særlige arkiveringssystem, Centera, der er beregnet til langtidslagring, og som er sikret mod datamanipulation. toft
HP på opkøb
Hewlett-Packard har købt selskabet Persist Technology og får dermed flere værktøjer til Information Life-cycle Management (ILM) i hus. Persist-softwaren har værtøjer til langtidslagrings af lovpligtige informationer og til indeksering, søgning og fremhentning af informationer. Partnerne oplyser ikke købsprisen. toft
CA optimerer lagring
Computer Associates har for nylig præsenteret sin strategi for ILM. Løsningen bygger videre på CA's BrightStor-lagringssoftware, der nu suppleres med en dokumentstyring, BrightStor Document Manager. I produktet indgår dokumentstyring fra open source-verdenen.
toft