Puha, det er jo noget med statistik, middel, standard afvigelse og så videre. Jeg skal gerne finde nogle formler frem i en eller anden forlængst glemt bog, hvis du har brug for det :)
Ekstremer er et relativt begreb. I nogle tilfælde kan ekstremer være 10% ved siden af middel og i andre tilfælde 1000% ved siden af.
Du bliver derfor nødt til at bestemme dig for hvad du vil lægge i begrebet ekstremer. Er det f.eks. alt som er uden for én standardafvigelse? Eller udenfor 2 gange standardafvigelsen?
Altså, du kan jo forholdsvist let finde gennemsnittet. Derefter løber du alle observationer igennem og finder variansen, og kvadratroden heraf er standard afvigelsen. Så kan du så løbe alle elementer igennem og rangere dem efter deres afvigelse i forhold til standardafvigelsen.
Men du kan så filtrere ud i listen på flere måder:
- Enten ved at sige, at de 10% af observationerne, der afviger mest er ekstremer, der skal sorteres fra (så sorteres der altid 10% fra uden hensyntagen til, hvor langt væk eller tæt på de er - det er blot de 10% længst væk)
- Eller du kan filtrere alle observationer ud, der er længere væk fra middel end x gange standardafvigelsen.
- Eller du kan kræve en standardafvigelse på max X og derved sortere alle dem ud, der ødelægger dette.
- Du kan også finde en distribution, som dine observationer burde følge og sortere ekstremer væk på denne vis.
imago-dei > Yep, og lige præcis dét er det svære. Functionen skal selv analyserer arrayen og "opdage" at værdierne "klumper" sammen omkring de 20, så i forhold til klumpen er 4 og 40 ekstremer.
Vores hjerne kan hurtigt gennemskue når vi kigger på dem at det er 4 og 40 der er ekstremer. Derfor er der en logik der kan udregnes. Spørgsmålet er selvfølgeelig om mine eller andres matematiske evner rækker.
Som barklund siger det er _meget_ relativt hvad ekstremer er. Hvis du havde et 11 tal i dine tal i dit første indlæg, eller et 14 tal, ville du så tælle det med i dine ekstremer eller ej? Det er spørgsmålet, og det kan kun løses ved at du selv definerer hvad du vil lægge i ekstremer.
Og hvad hvis du har din talrække ovenover og får tallene 1, 2, 4, 6, 2, 2, 4, 9, 13, 35, 42, 38, 33 med også? HVad er så ekstremer?
Pointen er at kun en matematisk definition kan løse problemet. Og den definition kan laves på mange måder.
Men som sagt x antal standardafvigelsen er et godt bud.
Tja, så ved du jo lige pludselig noget, som jeg ikke ved - du ved at "midten" ligger omkring 20. Hvis du har noget viden i den grad, så kan vi sagtens implementere det - men rent statistisk er 20,21,4000 er ret nytteløs liste - alt er ekstremt :)
jeg kommer til at droppe det her igen. Man skal enten bruge en middel værdi, som jeg ikke kender, eller have i hvert fald en 6 - 10 forskellige værdier, som jeg ikke nødvendigvis har. Ellers vil det ikke være til at stole på.
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.