Umiddelbart lyder det ikke logisk.
Spred dine data så meget som muligt for at få bedre performance.
Men der er mening med galskaben. Ved at sprede data i storage-laget kan man optimere performance for sin Business Intelligence-applikation.
Den fremgangsmåde benytter SAS Institute blandt andet til sine business intelligence -systemer.
”Når man arbejder med business intelligence, skal der flyttes store datamængder lynhurtigt. Vi udnytter hardwaren optimalt ved at sprede data så meget som muligt, fortæller Georg Morsing, der er servicedirektør hos SAS Institue.
Han fortæller, at de forskellige controllere arbejder bedst med spredte data, hvis man har et SAN.
"Det giver os flere IO-kanaler, der kan føde data til processorerne. Hvis vi derimod samler data på få diske, så bliver transporten af data fra diskene ind til CPU'erne en flaskehals,” siger han.
Business intelligence-systemer adskiller sig på mange måder fra mere traditionelle transaktionsorienterede systemer.
”Vi har ganske få brugere i den ene ende, der arbejder med meget store datamængder i den anden. Det er forskelligt fra mere traditionelle transaktionsbaserede systemer, hvor der er mange brugere, som hver især arbejder med relativt få data,” forklarer Georg Morsing.
Cluster-database
Derfor anvender SAS Institute en såkaldt cluster-database i stedet for en traditionel relationel database.
”SAS-databasen er en cluster-database, og altså ikke en hierarkisk eller en relationel database. SAS business intelligence-programmer og databasen er samtidigt designet til parallelprocessering. Når data er delt i små klumper kan man fordele data ud til de enkelte CPU'er i en flerprocessor-maskine,” siger Georg Morsing.
En række features kendt fra traditionelle databaser er samtidigt fjernet fra SAS Intelligence databasen for at opnå hurtig performance.
”Vi har fjernet enhver form for transaktionelt overhead fra databasen," siger Georg Morsing,
Han fortæller, at en relationel database traditionelt har en mængde information, der anvendes til at genskabe databasen, hvis der opstår en fejl midt i alle transaktionerne.
"Hvis strømmen eksempelvis tages fra en relationel database, så kan databasen genskabes inklusive transaktioner fra en transaktionslog. For business intelligence er al informationen vedrørende recovery, rollback og 2-fase-commit ved distribuerede transaktioner overflødig,” siger Georg Morsing.
Transaktionssystemer og BI smelter sammen
Selvom man opnår en performanceforbedring med en cluster-database, kan der være grunde til at køre business intelligence på en eksisterende relationel database.
Det kan være et spørgsmål om vedligeholdelses-ressourcer, en arkitekturbeslutning eller ønsket om at bevare data eet sted.
Samtidig ses en ny trend, hvor rene business intelligence-systemer med deres separate datawarehouse begynder at smelte sammen med online-transaktionelle systemer.
”Typisk laver man et datawarehouse, hvor data flyttes fra et produktionssystem til datawarehouse. Vi ser typisk en online-DB2 og så et datawarehouse-miljø, hvor data loades over om natten af et batchjob. De to verdener, der før var meget forskellige, begynder nu at flyde sammen. Der foregår en konvergens mellem online- og analyse systemer,” siger Georg Morsing.
Det sker, fordi der er et ønske om at indbygge datamining- og forecasting-teknikker ind i de normale online-systemer.
Datamining anvendes eksempelvis i forsikringsbranchen til at lave profilering af folk og i kreditkortselskaber til at lave analyse af kortsvindel.
Forecasting anvendes for eksempel til at forudse energiforbrug, trafikmønstre og nedbrud i maskiner.
”Man har gjort den slags ting i lang tid. Men måske skete det før kun en gang om året. Nu begynder man at gøre det dagligt. Der er et ønske om at indlejre den slags i de operationelle systemer; datamining og forecasting skal være en del af de daglige systemer,” forklarer Georg Morsing.
SAS Institute er derfor i gang med at udvikle måder at indbygge business intelligence i andre databaser end sin egen.
”Vi lancerer en ny teknologi, der gør, at vi indlejrer SAS-teknologien i andre databaser, så data ikke skal flyttes ud af databasen. Vi flytter noget af SAS business intelligence ned i databasen, så det kan køre på online-systemet. Det kan eksempelvis være credit-scoring.” siger Georg Morsing.
Indil videre har SAS Institute indgået aftale med Teradata om at indbygge SAS Business Intelligence i Teradatas database. Det er planen, at den aftale skal følges op med aftaler med andre databaseleverandører.