Notifikationer

Markér alle som læst Log ud

sblar Nybegynder

27. august 2003 - 19:56 Der er 29 kommentarer og
2 løsninger

Hvordan skal dette struktureres

Jeg skal 1 gang i timen hente 4096 værdier fra ca. 100 noder (altså 4096 værdier fra hver node). Værdierne skal gemmes i op til en uge. Det bliver meget hurtigt til en uhyre stor mængde data. Hvordan ville i strukturere disse data i tabeller således at man kan lave diverse udtræk senere. F.eks. alle 4096 værdier fra 1 node fra et bestemt klokkeslæt. Sagt på en anden måde skal det for hver eneste værdi fremgå fra hvilken node og på hvilket tidspunkt værdien er hentet.

Synes godt om

arne_v Ekspert

27. august 2003 - 20:03 #1

Det mest indlysende er vel en tabel med 4 felter:

node
nummer
tid
værdi

(nummer er 1-4096)

Synes godt om

sblar Nybegynder

27. august 2003 - 20:09 #2

arne v> Ja, den er jo så indlysende at jeg ikke engang har tænkt på den. Jeg er dog lidt bekymret for performance - i løbet af en uge vil der være ca. 68 millioner poster. Skulle det være noget problem?

Synes godt om

arne_v Ekspert

27. august 2003 - 20:18 #3

Jeg kan ikke forestille mig nogen struktur som vil give bedre performance.

Synes godt om

arne_v Ekspert

27. august 2003 - 20:34 #4

Det afgørende for performance er mere hvor længe du skal beholde data.

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:36 #5

Husk lige, at hvis de 68 mil. rækker skal kunne tilgås struktureret, så skal du også have indexes der svarer til hvad du slår op på, eller får du massive låsninger pga. full-scan.
Det koster i HW at gøre dette performende, idet du skal have et disk system bag, der hver sekund kan indsætte 114 rækker - Prøv med 3 diske i RAID-5, og du vil se at det ikke kan klare opgaven.
Alt efter hvilke andre oplysninger du har brug for, for størrelsen af rækkerne vil jeg tro at du til denne opgave som minimum har brug for følgende specialister:
1. Infrastruktur specialist, til at optimere netværket
2. Disk specialist til at optimere dit SAN eller disksystem
3. Database specialist til at optimere dit layout på ovenstående, samt verificere databasen og dine queries.
4. Trouble-shooter når alt ovenstående går galt

Arne har selvfølgelig ret hvad angår performance, idet det bare vil forværre situationen at lave flere tabeller i det skitserede setup.

Jeg tror det skal være noget mere konkret, inden jeg vil give et eksakt bud på denne opgave, og hvis jeg skulle løse den, så ville jeg bruge meget lang tid på analysen

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:40 #6

Hvis hver række kun er de ca. 60 bytes som oplæget går på, så kan man selvfølgelig "bare" lade DB serveren have nok processor kraft og memory, til at de ca. 4 GB der dannes pr. uge kan være i memory, men det kræver en 64bit maskine, idet SQL på 32 bit ikke kan anvende mere end 2GB på standard Windows server, men kan presses til 3GB på Advanced server - Men det er nok en dårlig ide.

Synes godt om

arne_v Ekspert

27. august 2003 - 20:41 #7

Hov - du sagde op til en uge.

Med 100 bytes per record betyder det en tabel på knap 7 GB.

Og det burde ikke være noget problem.

Synes godt om

arne_v Ekspert

27. august 2003 - 20:43 #8

larildsen>

Alle med high-performance database krav bruger vel RAID 0+1.

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:47 #9

Hmm Arne 7 GB - Hvilke queries skal der så køres ?
Jeg tror at design af tabellen (og indexes) samt HW har meget at sige.
Nogle tror at en DB kører fint på 3 diske i raid-5 (datafiler og transactionlog på samme diske), og det kører fint for nogle, men det er IKKE hign performance.
Jeg tror stadig på, alt efter hvad dette skal anvendes til, at I/O layoutet er alpha & omega, idet et snit på 114 rækker per sekund, måske ville have peaks MEGET større, og tilsvarende i perioder have meget mindre inserts, men det ved jeg jo IKKE, da opgaven IKKE er konkret nok

Synes godt om

arne_v Ekspert

27. august 2003 - 20:47 #10

Og 114 TPS lyder da slet ikke som noget problem i mine ører.

Synes godt om

arne_v Ekspert

27. august 2003 - 20:49 #11

Jeg er ikke spor bekymret over INSERT hvis de kan fordeles jævnt.

Og applikationen bør kunne håndtere peaks.

Men du har ret, hvis der er nogen som vil sidder og lave mega
store queries samtidigt, så begynder det at blive slemt.

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:49 #12

Jeg er IKKE så bekymret form 114TPS, som for hvordan dette ellers er organiseret, så længe vi har et IO system der virker.
Queries der ikke låser og IO systemer er det der rykker lige nu :-)
Design er altså efter min mening det vigtige

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:53 #13

Arne - Jeg kender IKKE din dagligdag, men jeg er til stidighed plaget af, at mine ideer om, at ALLE databaser i hele verden kører Raid 1+0 (helst med en del diske til data filer) ikke er virkelighed, når jeg møder mine kunder :-(

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:56 #14

Arne - Jeg mener 1+0 istedet for 0+1 - Det ligner selvfølgelig ordkløveri, men istedet for at spejle 2 stripe set, så vil jeg hellere stripe x-antal raid 1 set.
Tænk på at en disk falder ud i et setup med 2 spejlede raid-0 sets, dette betyder at hele den ene side af spejlet faldet ud :-(

Synes godt om

larildsen Nybegynder

27. august 2003 - 20:59 #15

Arne - hele denne diskussion er måske uinteressant for de fleste, men historien om disk layout er IKKE. Kan du IKKE fortælle lidt om hign performance disk layout til folket ?

Synes godt om

arne_v Ekspert

27. august 2003 - 21:08 #16

Jeg er ikke sikker på at jeg er den rette til det.

Jeg er ikke ekspert i den slags.

Men med RAID 0+1 af hot swapable diske og data og log på hvert sit
RAID system, så kan man ikke gå helt galt i byen hverken med performance
eller sikkerhed.

Men om spørgeren har budget til sådan en løsning ved jeg ikke.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 08:39 #17

Omkring datastrukturen, så kan du (hvis du ikke har mange felter), lave et covering index - dvs. et indeks, der indeholder alle de felter, der bruges i forespørgslen. Det betyder, at SQL Server ikke skal ned i data, men kan nøjes med at bruge index til forespørgslen.

Synes godt om

sblar Nybegynder

28. august 2003 - 09:13 #18

Ja der var da ihvertfald noget at tænke over. Jeg har efterfølgende opdaget at der vil være en hel del af de 4096 værdier der vil være 0 og hvis jeg undlader at gemme disse vil datamængden falde ganske betragteligt. Jeg tror simpelthen at jeg prøver mig frem og ser hvordan det går.
Setuppet er en Compaq Proliant ML350 G3 med 4 stk. xeon 2,2GHz og 2 stk hot swapable 36GB HDD i RAID 1+0. Hvordan synes det ser ud?

Send lige et svar larildsen så jeg kan fordele points.

Synes godt om

sblar Nybegynder

28. august 2003 - 09:14 #19

Og iøvrigt tak til benny.tordrup for tippet om covered index.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 09:18 #20

Hvad siger RAM?
Hvor mange processorer understøtter SQL Serveren (licenser)?

Synes godt om

sblar Nybegynder

28. august 2003 - 09:28 #21

768MB RAM, alle 4 CPU'er i brug i SQL.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 09:31 #22

Hvis jeg var dig, tror jeg, at jeg ville fylde mere RAM i. Vores produktionsserver med SQL har 1 Gb i - og vi snakker meget mindre datamængder end dig.

Synes godt om

arne_v Ekspert

28. august 2003 - 09:36 #23

Det ligner en rigtig god maskine.

RAM/CPU er dog ret lav, så jeg er enig med Benny - hvis den skal have
lidt ekstra så skal den have mere memory.

Synes godt om

sblar Nybegynder

28. august 2003 - 09:51 #24

Har netop bestilt 4GB, så nu er det op til budgettet.
Forresten er der ikke behov for nogen log på disse data. Er det nok at sætte recovery model til simple eller bør jeg gøre noget andet.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 09:53 #25

Hvis loggen er ligegyldig, så sørg for at sætte recovery til simple. Det får ikke log-filen til at vokse uhæmmet.

Synes godt om

sblar Nybegynder

28. august 2003 - 09:54 #26

Ups, der røg alle pointene. Jeg forsøgte ellers at give 20 til hver svar. Hvad nu larildsen?

Synes godt om

larildsen Nybegynder

28. august 2003 - 10:34 #27

Hmmm sblar, pyt med pointene.
Jeg ville jo nok sørge for lidt flere diske end 2 stk, da du også har din transaktionslog at tænke på, og denne bør ligge på et separat raid-1 sæt.
hvis du skal have 114 tps tror jeg dine diske får meget travlt.
Een disk kan normalt lave 150-200 io operationer per sekund, men qua at logfilen ligger sammt med resten vil jeg tro at du har et potentielt problem.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 10:35 #28

Da ikke, hvis han sætter recovery model til simple? Det reducerer log-filen til mindre end 2 Mb. Skrives der overhovedet til log-filen, hvis recovery er simple?

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 10:37 #29

Jo, der skrives til loggen, så en sep. disk til log vil være en fordel.

Synes godt om

larildsen Nybegynder

28. august 2003 - 10:39 #30

Der skrives nøjagtigt lige så meget til logfilen i simple mode, den eneste forskel er at i simple mode fjerner den de commitede transaktioner ved checkpoint, og kan dermed genbruge pladsen - Nøjagtigt det samme som SQL7's truncate log on checkpoint.
Og lav ny ikke logfilen for lille, og lad den ikke udvide sig med mindre end 200-500 mb per udviddelse.

Synes godt om

bennytordrup Nybegynder

28. august 2003 - 10:43 #31

Nu vi så nævner udvidelse af filen, så bør du alvorligt beregne hvor meget plads, der typisk vil være behov for. Der nævnet 7 Gb et sted. Det vil være en fordel for dig at starte med at lave databasen på mindst 7 Gb. Derefter skal du udvide i blokke på et fast antan Mb (f.eks. 500 Mb eller 1 Gb). Procentvis ændring vil tage længere og længere tid, efterhånden som databasen vokser.

Ved at lave databasen med en startstørrelse på 7-8 Gb (eller hvad du regner dig frem til) undgår du, at databasen skal udvides kraftigt mange gange inden, du når op på den normale driftstørrelse. Udvidelserne tager tid for SQL Serveren - og desuden risikerer du, at den fysiske databasefil bliver fragmenteret i filsystemet. Det gør du ikke, hvis du laver startstørrelsen stor nok til, at udvidelser ikke bliver nødvendige.

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

SQL kurser

Computerworld tilbyder specialiserede kurser i database-management

Se alle SQL kurser

Flere spørgsmål fra MS SQL kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Kan ikke connecte til Microsoft SQL 2005 server fra Windows 11 Af MartinBall i MS SQL	2	24/06/202509:38	24/06/202511:31
Danske karakterter i simpel insert Af boris i MS SQL	2	25/04/202414:05	29/04/202411:41
Kan ikke connecte til sql serveren Af simsen i MS SQL	2	05/01/202417:02	05/01/202420:51
Count med NOT IN og 2 conditions Af sorenmt84 i MS SQL	2	08/11/202308:37	08/11/202310:32
Top X af group Af totalpc i MS SQL	1	18/10/202321:23	09/11/202313:08

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

09:03

Et kinesisk kampfly i frit fald - og en verden, som vi slet ikke ønsker os

13/05

Nedtælling til skæbnesvanger messe for Apple: Det kan du forvente fra det enorme WWDC-show

13/05

Han opfandt Oculus Rift og står nu bag vildt AI-baseret våbenfirma: Har fordoblet sin værdi på et år - er nu 400 milliarder kroner værd

13/05

Netcompany-stifterne André Rogaczewski og Claus Bo Jørgensen skovler penge ind: Så meget scorede de i 2025

13/05

BitLocker kan knækkes på få minutter med en USB-stick: Sådan kan du beskytte din pc

13/05

Kæmpe-strejke kan snart lamme Samsung: Forhandlinger brudt sammen - 50.000 medarbejdere vil nedlægge arbejdet

13/05

Har ikke andre muligheder: Danske universiteter nødt til at betale 64 millioner kroner til Oracle i ny licens-afgift

13/05

Alle CISO'er er ramt af dette paradoks: Jo bedre arbejdet udføres, jo mindre værdifuldt fremstår det

13/05

Claus Rydkjær vil som ny topchef gennemtrawle hele NNIT-forretningen efter svagt kvartal: "Vi vender hver en sten"

13/05

EU får adgang til OpenAI's nye cyber-værktøj - vil følge udrulningen tæt og håndtere sikkerhedsbekymringer

13/05

Windows, Azure, Office og SharePoint truet: Microsoft patcher stort antal sårbarheder med kæmpe opdatering

Vis flere artikler

IT-JOB

Region Midtjylland

Koordinator til M365‑teamet – bliv vores samlende bindeled mellem forretning, drift og udvikling

Indenrigs- og Sundhedsministeriet

IT/AI-projektleder til Indenrigs- og Sundhedsministeriets departement

Banedanmark

Projektleder til IT-sikkerhed

Digitaliseringsstyrelsen

Systemforvalter med forståelse for cybersikkerhed til borger.dk

AVK Holding A/S

Stå for velsmurte endpoints – og bidrag til vores tekniske retning

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 20:48	Bred buet skærm vs. 2 skærme Af Nanarsi i Skærme
I går 18:07	Tilslut printer til netværk med WPS - hvis WPS slukkes på Router mistes forbindelse. Af Uvanga i Wifi
11/0521:05	Questyle M15i lydforstærker Af valby i Diverse
11/0518:27	Mærkeligt ikon på proceslinjen Af ErikHg i Windows
11/0513:54	Jeg skal have indstaleret Garmin express Af skolevej321 i Andet software

White papers

Arctic Wolf Security Operations Report 2025: Indblik i moderne sikkerhedsdrift
Arctic Wolf
E-fakturering bliver et krav – er din forretning klar?
Tabellae
Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta
Erfaringer fra frontlinjen: Sådan ændrer trusselsbilledet sig
Arctic Wolf

Flere white papers »