Computerworld News Service: Big data anses for at være en overordentligt nyttig tilgang hos de fleste store virksomheder.
Med de rette værktøjer til dataanalyse kan man få mening og forretningsværdi ud af sine data og jo flere data, des bedre.
Men ligesom på så mange andre områder, kan man også her få for meget af det gode, lyder det fra eksperter i såkaldt information governance.
Deres budskab er, at man i erhvervslivet har behov for at gøre mere end blot at beskytte sine data mod tyveri - man bør faktisk skille sig af med nogle af dem - både af økonomiske og juridiske grunde.
Konceptet har fået forskellige mere eller mindre kryptiske betegnelser på engelsk såsom defensible disposition, defensible deletion og active expiration.
De kunne på dansk blive til udtryk som forsvarlig disponering, forsvarlig sletning og aktivt udløb, men lad os bare holde os til at kalde det, at man vælger at slette nogle data.
Kan reducere omkostninger
Barry Murphy, der er medstifter af og ledende analytiker hos eDJ Group, fremhæver da også i et indlæg på eDiscovery Journal, at terminologien er underordnet det faktum, at man som virksomhed "kan reducere omkostninger og risici ved proaktivt at skille sig af med unødvendige data."
Murphy fortæller CSO Online, at det er sandt, at prisen på lagerplads både placeret lokalt og i cloud fortsat falder.
"Man kunne argumentere for, at de faldende priser på storage i kombination med billigere platforme til databehandling såsom Hadoop gør det økonomisk realistisk at opbevare data i al evighed," siger han.
"Men mængden af data stiger hurtigere, end prisen på storage falder. En så stor del af erhvervslivets data er enten duplikerede eller unødvendige, at prisen for at beholde dem er større, end hvad man taber ved at slette dem."
Jim McGann, der er markedsføringsdirektør hos Index Engines, udtalte sidste år i et interview med Government Technology, at han i løbet af de sidste fem år havde lagt mærke til, at flere organisationer iværksatte initiativer for at "rense den 'sø af data', der er blevet skabt."
Grundene er juridiske såvel som økonomiske, forklarer han. Indtil for cirka 15 år siden kunne en virksomhed gemme hvad som helst og let skjule oplysninger, der kunne blive juridisk belastende, men sådan er det ikke længere i dag, fremhæver han:
"Advokater og dommere er mere it-kyndige og de accepterer ikke længere undskyldninger, der bygger på kompleksitet og omkostninger."
Den udlægning er Barry Murphy enig i. "Omkostningerne og risiciene ved e-discovery kan banke et kæmpe hul igennem enhver vurdering af de økonomiske omkostninger ved informationsstyring," kommenterer han.
Disse dokumenter bør slettes
Der gælder andre regler for opbevaring af elektroniske dokumenter end papirdokumenter, da de som regel inkluderer metadata, der kan blive vigtige som beviser.
For eksempel kan dato og tid for oprettelsen af et elektronisk dokument bruges som bevis i en sag om ophavsret.
Det betyder ikke, at man som virksomhed blot kan skille sig af med ethvert elektronisk dokument, man frygter, kan blive juridisk belastende.
Men Murphy oplyser, at amerikanske virksomheder i henhold til de såkaldte Federal Rules of Civil Procedure får frit lejde til at slette data i overensstemmelse med standardprocedurerne, "så længe der er en proces på plads til at sørge for, at man ikke sletter information, der med rimelighed kan forudsiges at blive relevant i forbindelse med igangværende eller forventede retssager, undersøgelser eller revisioner."
Ingen forretningsværdi
Murphy forklarer, at "ethvert informationsaktiv, der er et duplikat eller ikke har nogen forretningsværdi, ender i bunken af ting, der skal slettes."
Han bemærker dog, at de fleste organisationer endnu ikke er "modne" nok til at bedømme datas værdi nøjagtigt. I stedet bruger de ifølge Murphy "tidsbaserede opbevaringspolitikker."
For eksempel sletter mange virksomheder enhver e-mail i en medarbejders indbakke efter 90 dage. Hvis medarbejderen ønsker at beholde en e-mail i længere tid, skal den trækkes over i en central arkivmappe, hvor medarbejderen kan få adgang til den ud over perioden på 90 dage."
Det er ifølge Murphy "bedre og langt mere forsvarligt at anvende software, der sørger for at sætte en sletning i bero, hvis der er juridiske forhold, der taler for det, hvilket kan være tilstrækkeligt til at overbevise en dommer om, at alle relevante elektronisk opbevarede informationer er bevaret. Standarden er at have gjort en rimelig indsats fremfor at opnå perfektion."
Jim McGann anbefaler, at man starter i det små. "Det kan for eksempel være at slette oplysninger om tidligere medarbejdere eller at kortlægge hvilke data, der ikke er blevet tilgået i fem år, og som derfor kan flyttes til billigere storage såsom cloud eller med tiden slettes," forklarer han.
Han fremhæver dog, at det kræver prioritering. "De datamiljøer, der udgør den højeste risiko, er e-mailservere og forældet båndbackup," udtaler han til Government Technology.
"E-mail er den mest almindelige kilde til beviser i retssager og i forbindelse med revision. Forældet båndbackup indeholder øjebliksbilleder af alting inklusiv e-mail og filer."
Derfor anbefaler han, at man kortlægger sine data og inkluderer ting som dataenes alder, hvornår de sidst blev tilgået eller ændret, ejer, opbevaringssted, e-mailafsender og -modtager og endda følsomme nøgleord.
"En kortlægning af ens data vil give den viden, man har brug for til at beslutte, om filer og e-mail skal beholdes eller slettes. Dermed kan en sådan kortlægning hjælpe til at handle ud fra disse beslutninger og forsvarligt slette, hvad man ikke længere har brug for, og arkivere hvad man er nødt til at beholde."
Oversat af Thomas Bøndergaard