Sådan får du bedre performance på din storage

Tema: Når store datamængder skal analyseres, kan datatransporten fra storage til processorerne være en flaskehals. Læs, hvordan du kan løse dette problem.

Umiddelbart lyder det ikke logisk.

Spred dine data så meget som muligt for at få bedre performance.

Men der er mening med galskaben. Ved at sprede data i storage-laget kan man optimere performance for sin Business Intelligence-applikation.

Den fremgangsmåde benytter SAS Institute blandt andet til sine business intelligence -systemer.

”Når man arbejder med business intelligence, skal der flyttes store datamængder lynhurtigt. Vi udnytter hardwaren optimalt ved at sprede data så meget som muligt, fortæller Georg Morsing, der er servicedirektør hos SAS Institue.

Han fortæller, at de forskellige controllere arbejder bedst med spredte data, hvis man har et SAN.

"Det giver os flere IO-kanaler, der kan føde data til processorerne. Hvis vi derimod samler data på få diske, så bliver transporten af data fra diskene ind til CPU'erne en flaskehals,” siger han.

Business intelligence-systemer adskiller sig på mange måder fra mere traditionelle transaktionsorienterede systemer.

”Vi har ganske få brugere i den ene ende, der arbejder med meget store datamængder i den anden. Det er forskelligt fra mere traditionelle transaktionsbaserede systemer, hvor der er mange brugere, som hver især arbejder med relativt få data,” forklarer Georg Morsing.

Cluster-database

Derfor anvender SAS Institute en såkaldt cluster-database i stedet for en traditionel relationel database.

”SAS-databasen er en cluster-database, og altså ikke en hierarkisk eller en relationel database. SAS business intelligence-programmer og databasen er samtidigt designet til parallelprocessering. Når data er delt i små klumper kan man fordele data ud til de enkelte CPU'er i en flerprocessor-maskine,” siger Georg Morsing.

En række features kendt fra traditionelle databaser er samtidigt fjernet fra SAS Intelligence databasen for at opnå hurtig performance.

”Vi har fjernet enhver form for transaktionelt overhead fra databasen," siger Georg Morsing,

Han fortæller, at en relationel database traditionelt har en mængde information, der anvendes til at genskabe databasen, hvis der opstår en fejl midt i alle transaktionerne.

"Hvis strømmen eksempelvis tages fra en relationel database, så kan databasen genskabes inklusive transaktioner fra en transaktionslog. For business intelligence er al informationen vedrørende recovery, rollback og 2-fase-commit ved distribuerede transaktioner overflødig,” siger Georg Morsing.

Transaktionssystemer og BI smelter sammen

Selvom man opnår en performanceforbedring med en cluster-database, kan der være grunde til at køre business intelligence på en eksisterende relationel database.

Det kan være et spørgsmål om vedligeholdelses-ressourcer, en arkitekturbeslutning eller ønsket om at bevare data eet sted.

Samtidig ses en ny trend, hvor rene business intelligence-systemer med deres separate datawarehouse begynder at smelte sammen med online-transaktionelle systemer.

”Typisk laver man et datawarehouse, hvor data flyttes fra et produktionssystem til datawarehouse. Vi ser typisk en online-DB2 og så et datawarehouse-miljø, hvor data loades over om natten af et batchjob. De to verdener, der før var meget forskellige, begynder nu at flyde sammen. Der foregår en konvergens mellem online- og analyse systemer,” siger Georg Morsing.

Det sker, fordi der er et ønske om at indbygge datamining- og forecasting-teknikker ind i de normale online-systemer.

Datamining anvendes eksempelvis i forsikringsbranchen til at lave profilering af folk og i kreditkortselskaber til at lave analyse af kortsvindel.

Forecasting anvendes for eksempel til at forudse energiforbrug, trafikmønstre og nedbrud i maskiner.

”Man har gjort den slags ting i lang tid. Men måske skete det før kun en gang om året. Nu begynder man at gøre det dagligt. Der er et ønske om at indlejre den slags i de operationelle systemer; datamining og forecasting skal være en del af de daglige systemer,” forklarer Georg Morsing.

SAS Institute er derfor i gang med at udvikle måder at indbygge business intelligence i andre databaser end sin egen.

”Vi lancerer en ny teknologi, der gør, at vi indlejrer SAS-teknologien i andre databaser, så data ikke skal flyttes ud af databasen. Vi flytter noget af SAS business intelligence ned i databasen, så det kan køre på online-systemet. Det kan eksempelvis være credit-scoring.” siger Georg Morsing.

Indil videre har SAS Institute indgået aftale med Teradata om at indbygge SAS Business Intelligence i Teradatas database. Det er planen, at den aftale skal følges op med aftaler med andre databaseleverandører.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
itm8 A/S
Outsourcing, hosting, decentral drift, servicedesk, konsulentydelser, salg og udleje af handelsvarer, udvikling af software.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Virksomhedsplatforme i forandring: Hvordan navigerer du i den teknologiske udvikling?

Hvordan finder du balancen mellem cloud- og hybride løsninger? Hvordan integrerer du legacy-applikationer ind i dit nye ERP-setup? Hvordan undgår du at havne i statistikken over store ERP-projekter, der fejler eller overskrider budgetterne?

14. maj 2025 | Læs mere


Computerworld Summit 2025, København – AI transforming business

Årets uomgængelige konference for dig, der er med til at træffe beslutninger om din organisations teknologiske fremtid, og vil have det samlede overblik over aktuelle tendenser i IT-branchen.

27. maj 2025 | Læs mere


Årets CIO 2025

Vi skal finde Årets CIO 2025 og den kvinde eller mand, som i et helt år kan bryste sig af at være landets bedste CIO.

03. juni 2025 | Læs mere






White paper
Tidsbegrænset kampagne: Overvejer du at udskifte eller tilføje printere i din forretning? Vi kan tilbyde én eller flere maskiner gratis