Avatar billede aitnemed Novice
16. april 2021 - 12:12 Der er 3 kommentarer og
2 løsninger

Beregne gennemsnit - men ekskludere outliers

Hej folkens

Jeg har data (tal) for hver dag i måneden. De fleste dage ligger tallene på mellem 100 og 1000 - men pga. en fejl. er der en periode på 4 dage, hvor tallene var skyhøje - oppe omkring 200.000.

Hvis jeg beregner månedens gennemsnit, vil det f.eks. se således ud (for nemhedens skyld antager jeg, at tallet er 500 alle dage, hvor der ikke er fejl og at der er 30 dage i måneden):

Gennemsnit inkl. outliers: (500 x 26 + 4 x 200.000)/30 = 27.100

Jeg vil selvfølgelig gerne beregne gennemsnittet uden outliers, så beregningen ser således ud: (500 x 26)/26 = 500

Mit spørgsmål er nu:
Er der nogen her, der kan gennemskue, hvordan jeg sammensætter en beregning, som selv spotter markante outliers og antallet af dage med markante outliers - så jeg kan ekskludere disse data i beregningen af gennemsnittet?


Jeg kan tilføje, at jeg arbejder i Google Sheets - men da jeg ikke fandt det som mulighed, valgte jeg Excel.
Avatar billede jens48 Ekspert
16. april 2021 - 12:28 #1
Noget i stil med nedenstående vil kunne bruges:

=AVERAGE((A1:A20)*(A1:A20<2000))
Avatar billede igoogle Forsker
16. april 2021 - 12:29 #2
Du kan bruge median reference punkt og så tælle hvor mange der ligger inden for +- 50% af denne værdi
Avatar billede jens48 Ekspert
16. april 2021 - 14:02 #3
Denne formel er bedre:

=AVERAGEIF(A1:A20;"<"&2000)

AVERAGEIF hedder på dansk MIDDEL.HVIS
Avatar billede xl-Enthusiast Ekspert
16. april 2021 - 14:32 #4
Avatar billede aitnemed Novice
16. april 2021 - 20:52 #5
Hej alle

Tak for nogle gode bud.

Jeg fandt en anden tilgang - men særligt xl-Enthusiasts løsning hjalp mig med at få sat nogle mere rammende ord på udfordringen... Hvilket hjalp mig videre.

Min løsning var at beregne og bruge

Kvartil 1
Kvartil 3
Interkvartil range (IQR)
Afvigelsesfaktor (IQR rule = 1,5)

Ved at beregne kvartilerne og IQR kan jeg ca. finde frem til den tolerable afvigelse i toppen (øvre grænse) og i bunden (nedre grænse). Alle tal der ligger uden for disse maks. og min. tolerancer er afvigelser.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester