Terabytes til alle

Denne artikel stammer fra det trykte Computerworlds arkiv. Artiklen blev publiceret den CTO d. 4. marts 2005.


Det sidste års tid er terabyte-servere kommet prismæssigt inden for rækkevidde af mindre virksomheder. Men det stiller it-afdelingerne over for nye udfordringer at administrere og lave backup af de store datamængder.
Af Jesper Troelstrup
Terabyte-server-løsninger er nede i en pris, der bringer dem inden for mindre virksomheders rækkevidde. Men samtidig med, at en lang række it-afdelinger har sat de nye højkapacitetsservere op, har de måttet erkende, at anvendelsen stiller nye udfordringer: Når man får ekstra kapacitet, vil man være tilbøjelig til at udnytte den. Dermed er det pludselig meget større datamængder, som it-afdelingen skal administrere. For eksempel kan det blive sværere at opretholde restriktionerne for, hvad brugerne kan gemme af filer og e-post. Og som en it-chef siger, er det jo lettere at gemme end at rydde op. Det kan gøre det til en betydelig opgave for eksempel at sørge for, at der bliver taget backup.
Det var en ny teknologi, der banede vejen for de billigere terabyte-servere.
- Gennembruddet kom, da de serielle ATA-harddiske (SATA) begyndte at komme frem for omkring et år siden. De er hurtigere og billigere end den hidtil anvendte parallelle ATA-diskstyring eller SCSI. Derudover har de den fordel, at man kan lave såkaldt hotswap og skifte en disk ud, mens serveren kører, siger marketingdirektør Ulrik Holm Nielsen fra forhandleren Nem Computer.
Prisforholdet er ifølge Ulrik Holm Nielsen cirka 1 til 8, idet han anslår prisen for SCSI-løsning på 250 gigabyte til at være omkring 10.000 kroner, mens han regner med 1.200 kroner for en SATA-løsning.
- Det er klart, at SCSI har bredere anvendelser, men til anvendelser, hvor du har store lagringsbehov og begrænsede midler, bliver SATA et attraktivt alternativ. Det gælder en række mellemstore og mindre selskaber, og det gælder et forholdsvis stort antal offentlige virksomheder, siger han.

Også et selskab, der er specialiseret i storage som TSS (Total Storage Solutions), oplever, at virksomhederne gemmer langt flere data.
- Tidligere sagde vi, at vi gik efter de virksomheder, der havde mere end 200 gigabyte storage. I dag har den samme type virksomheder mere end to terabyte. Men det, man ofte glemmer, er, at selv om bytene er gået ned i pris, er det ikke blevet billigere at administrere dem, siger direktør Torben Jørgensen fra TSS.
Med de større servere får også mindre virksomheder behov for en storagestrategi for eksempelvis, hvem der skal bestemme, hvad der skal gemmes, og hvornår data kan føres fra hurtige lagermedier til langsommere og billigere. Fastlæggelsen af en sådan storagestrategi fører ofte til etableringen af et såkaldt information lifecycle management-system. Det er blot de færreste mindre og mellemstore virksomheder og organisationer, der er nået hertil.
- Hidtil har der ikke været vilje til at investere i dette, selv om det er muligt at opnå betydelige besparelse ved at vælge den rigtige storagepolitik. I stedet smider man billigere storageboxe efter problemerne, siger Torben Jørgensen.
Et eksempel på dette ser man i nogle virksomheder, hvor man forsøger at komme uden om den besværlige backup-problematik ved terabyte-serverne ved at sætte en ekstra storageserver op, der spejler alle data - i stedet for at tage backup. Dette mener Torben Jørgensen dog ikke er en løsning.
- Det giver ikke mulighed for at genskabe data. Får du lavet noget forkert, har du det på denne måde blot liggende to steder. Man har ikke det, vi i branchen kalder disaster recovery, siger han.
Når det endnu ikke er blevet almindeligt i mindre og mellemstore virksomheder at benytte storageadministrationssystemer til terabyte-serverne, er det dog ikke udelukkende et spørgsmål om indstilling: Der findes værktøj, der gør det muligt for en person at administrere langt flere data end tidligere til virksomheder med store behov, men disse redskaber er ifølge Torben Jørgensen endnu ikke helt på plads til mere almindelige virksomheder. Der er dog tegn på, at de er ved at være klar, mener han.
- I open source-verdenen har man i øjeblikket fokus på virtualisering af storage, som en forudsætning for bedre udnyttelse af den eksisterende storage-kapacitet og som strategi til at administrere storage på tværs af forskellige platforme, siger Torben Jørgensen.

Det Humanistiske Fakultet på Københavns Universitet er en af de offentlige institutioner, der benytter sig af de nye muligheder for billigere adgang til mere storage. Her administrerer IT-Centret i øjeblikket syv servere med hver cirka 1,3 terabyte i produktionskapacitet. Serverne har tre terabyte rå kapacitet hver; men kører RAID-10 med hotspare, hvilket giver hver server knap den halve kapacitet i produktion.
- Med terabyte-serverne er vi blandt andet i stand til at have alle brugerne på et begrænset antal servere. Det gør brugeradministrationen betydelig lettere på et fakultet som det humanistiske, hvor brugerne ofte flytter mellem de enkelte institutter i løbet af deres ansættelses- og studieforløb, siger it-chef Jakob Jørgensen fra Det Humanistiske Fakultet, KU.
Ud over, at terabyte-serverne på flere punkter forenkler administrationen, giver de også brugerne en række fordele.
- Vi kan placere alle brugerprofiler centralt, hvilket medfører, at det er lettere og hurtigere at skifte en brugers maskine. Desuden har brugerne adgang til deres egne indstillinger som for eksempel HTTP-bookmarks, uanset om de sidder på kontoret eller på et bibliotek, siger Jakob Jørgensen.
Det Humanistiske Fakultet har behov for syv servere af denne størrelse, fordi man benytter to filservere, to postservere og to backup-servere for at have redundans. Den syvende server anvendes af it-supporten til installationer på klientmaskiner, midlertidige flytninger af brugernes lokalt gemte data, harddisk images til klientmaskiner med mere.
IT-Centret administrerer omkring 17.500 brugere fordelt på cirka 1.500 ansatte og 16.000 studerende. Dog er det kun rundt regnet 8.000 studerende, der aktivt anvender it-faciliteterne til dagligt.

For at løse de backup-problematikker, det rejser at køre med disse datamængder, er Det Humanistiske Fakultet ved at indføre følgende procedurer:
Hver nat kopieres en brugers ændrede og nyoprettede filer til brugerens mappe på backupserverne og placeres i en mappe med datostempel. Denne mappe har brugeren så adgang til via HTTPS-logon, hvilket medfører, at brugerne selv er i stand til at klare restore-procedure i forbindelse med brugerfejl.
Brugeren kan selv hente dokumenter fra de enkelte dage syv dage bagud. 8-14 dage bagud samles dokumenterne i en uge-mappe, hvor de nyeste versioner fra perioden er tilgængelige. Det betyder, at dokumenter som er 14 dage gamle, overskrives med indtil 8 dage gamle versioner. Det samme gælder for 15-21 dage gamle og 22-28 dage gamle filer.
Brugeren har således mulighed for selv at hente filer fra syv dag-mapper og tre uge-mapper - i alt 28 dages arbejde.
Når en uge-mappe er mere end 28 dage gammel, placeres dens indhold i en komprimeret fire-ugers-mappe, hvor ældre filversioner overskrives, og som kun IT-Centrets driftgruppe har adgang til i forbindelse med restore-procedurer.
- Vi har endnu ikke tilstrækkelige erfaringer i, hvor langt tilbage i tiden, der er plads til at gemme fire-ugers-mapper; men vi regner med, at et års fuld backup ikke vil give anledning til pladsproblemer, siger Jakob Jørgensen.
Det skyldes, at langt størsteparten af vores produktion er tekstfiler, som kan komprimeres ganske meget, og at billed- og videofiler ændres sjældent, når de først er lavet.
Herudover benyttes båndbackup. Her følge man det offentliges retningslinier, der bygger på Dansk Standards DS484, og herudover har Københavns Universitet selv et sæt arkiveringsregler.
Den skitserede backup-procedure bygger på det såkaldte server2server-princip. Det kan synes som en kompliceret struktur, men ifølge it-chefen giver det en række fordele.
- Båndbackuppen belaster ikke fil- og postservere i væsentlig grad, og omvendt undgår vi, at brugerne ikke belaster serverne, når vi skal tage båndbackup. Brugerfejl kan hurtigt rettes af brugerne selv. Desuden giver det en båndbreddemæssig fordel, at komprimering er sket inden, båndbackuppen startes, hvilket giver et bedre throughput, siger Jakob Jørgensen.
Samtidig er afdelingen ved at etablere et system, der bygger på et nyt princip for backup, idet det udelukkende registrerer de ændringer, der er sket i filer og dokumenter, for dermed at gøre backuppen mere overkommelig.

Institut for Miljø & Ressourcer på DTU er en anden offentlig institution, der for halvandet år siden anskaffede en server med en kapacitet på omkring halvanden terabyte i effektiv diskplads baseret på seriel ATA med otte diske a 250 gigabyte bundet sammen med RAID.
- Den primære anvendelse er de data, som de 130 ansatte forskere og i gennemsnit 50 studerende gemmer på nettet. Som udgangspunkt er de begrænset til at gemme 500 megabyte, men de kan få mere, hvis de har behov for det. Inden afdelingen anskaffede terabyte-serveren, var denne grænse på 100 megabyte, fortæller it-ansvarlig Andreas Kyster fra Miljø & Ressourcer på DTU.
De forholdsvis store databehov opstår blandt andet ved laboratorieforsøg, hvor der kan blive opsamlet store mængder data, derfor er det også de fastansatte forskere, der bruger størstedelen af denne kapacitet. Der er afsat 500 gigabyte til disse data, hvoraf 350 var ledige den dag sidst i januar, da vi talte med den it-ansvarlige. Af de 900 gigabyte, der benyttes til andre formål var omkring 200 gigabyte ledige.
I dag tager afdelingen backup på fem sæt a tre 250 gigabyte USB-harddiske: En til en omfattende ugentlig backup, en til daglige ændringer og en til et særligt EU-projekt. De fem sæt afløser så hinanden hen over en måned.

Billedtekst:
administration
- Det, man ofte glemmer, er, at selv om bytene er gået ned i pris, er det ikke blevet billigere at administrere dem, siger direktør Torben Jørgensen, Total Storage Solutions.
Foto: Torben Klint

Billedtekst:
Smidigere - Med terabyte-serverne er vi blandt andet i stand til at have alle brugerne på et begrænset antal servere. Det gør brugeradministrationen betydelig lettere på et fakultet som det humanistiske, hvor brugerne ofte flytter mellem de enkelte institutter, fortæller it-chef Jakob Jørgensen fra Det Humanistiske Fakultet på Københavns Universitet.
Foto: Torben Klint

Boks:

ATA - advanced technology attachment
Med den serielle ATA-standard (advanced technology attachment) blev det som nævnt i artiklen muligt at sætte en ny disk i serveren, uden at skulle lukke den ned.
Men seriel ATA muliggjorde også mere professionel anvendelse ved at have bedre kontrol med diskkommandoer og data end den tidligere ATA-standard, hvorved man undgår en række diskproblemer. Desuden har den serielle standard såkaldt tagged command quering, hvilket betyder, at systemet kan holde styr på op til 32 diskkommandoer, og dermed forbedre ydelsen.
Disse faciliteter gør seriel ATA konkurrencedygtig med SCSI (small computer system interface) til SAN (storage area networks) - især når man yderligere benytter RAID-teknologien (redundant array of independent disks), som populært sagt betegner teknologier til mere effektivt at binde flere diske sammen til en stor virtuel disk.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
KEYBALANCE A/S
Udvikling og salg af økonomisystemer samt CRM og MPS. Systemer til blandt andet maskinhandlere, vvs-branchen, vognmænd, låsesmede,handelsvirksomheder

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Bliv klar til AI Act: Det vil påvirke både din udvikling, drift og organisation

Fordelene ved at anvende kunstig intelligens bliver stadig mere udtalte, og både som virksomhed og myndighed er det i stigende grad uholdbart ikke at udforske mulighederne. Men der er også risici forbundet på den nye teknologi, og på dette formiddagsseminar ser vi på, hvordan verdens første regulatoriske kompleks – EUs kommende AI Act – adresserer behovet for en etisk, ansvarlig og kontrolleret anvendelse af AI.

20. august 2024 | Læs mere


Det Digitale Produktpas

Kom med og hør om, hvordan du kommer i gang med at sikre din virksomhed er klar til Det Digitale Produktpas. Vi sætter fokus på, hvordan du bliver klædt på til at få styr og struktur på dine data, samt hvilke krav du skal sætte til dine leverandører og andre i din værdikæde, for at sikre den nødvendige information er tilgængelig.

21. august 2024 | Læs mere


Cyber Security Summit 2024

På Cyber Security Summit får du indsigt i det aktuelle trusselslandskab, overblikket over de nyeste værktøjer og trends indenfor sikkerhedsløsninger, indsigt i de relevante rammeværktøjer og krav samt de bedste løsninger og værktøjer til at sikre effektiv drift og høj compliance.

27. august 2024 | Læs mere