Hvordan beregne avvikere

En outlier er en verdi i et datasett som er langt fra de andre verdiene. Outliers kan være forårsaket av eksperimentelle eller målefeil, eller av en langhalet populasjon. I de tidligere tilfellene kan det være ønskelig å identifisere avvikere og fjerne dem fra data før du utfører en statistisk analyse, fordi de kan kaste resultatene slik at de ikke representerer prøven nøyaktig befolkning. Den enkleste måten å identifisere avvikere er med kvartilmetoden.

Sorter dataene i stigende rekkefølge. Ta for eksempel datasettet {4, 5, 2, 3, 15, 3, 3, 5}. Sortert, er eksemplets datasett {2, 3, 3, 3, 4, 5, 5, 15}.

Finn medianen. Dette er tallet hvor halvparten av datapunktene er større og halvparten er mindre. Hvis det er et jevnt antall datapunkter, blir de to midterste gjennomsnittet. For datasettet eksempel er midtpunktene 3 og 4, så medianen er (3 + 4) / 2 = 3,5.

Finn den øvre kvartilen, Q2; dette er datapunktet der 25 prosent av dataene er større. Hvis datasettet er jevnt, må du gjennomsnittlig de 2 poengene rundt kvartilen. For datasett eksemplet er dette (5 + 5) / 2 = 5.

Finn den nedre kvartilen, Q1; dette er datapunktet der 25 prosent av dataene er mindre. Hvis datasettet er jevnt, må du gjennomsnittlig de 2 poengene rundt kvartilen. For eksempeldataene (3 + 3) / 2 = 3.

Trekk den nedre kvartilen fra den høyere kvartilen for å få interkvartilområdet, IQ. For datasett eksemplet, Q2 - Q1 = 5 - 3 = 2.

Multipliser interkvartilområdet med 1,5. Legg dette til den øvre kvartilen og trekk den fra den nedre kvartilen. Ethvert datapunkt utenfor disse verdiene er en mild outlier. For eksempelsettet er 1,5 x 2 = 3; dermed 3 - 3 = 0 og 5 + 3 = 8. Så enhver verdi mindre enn 0 eller større enn 8 vil være en mild outlier. Dette betyr at 15 kvalifiserer som en mild avviker.

Multipliser interkvartilområdet med 3. Legg dette til den øvre kvartilen og trekk den fra den nedre kvartilen. Ethvert datapunkt utenfor disse verdiene er en ekstrem outlier. For eksempelsettet er 3 x 2 = 6; dermed 3 - 6 = –3 og 5 + 6 = 11. Så enhver verdi mindre enn –3 eller større enn 11 vil være en ekstrem outlier. Dette betyr at 15 kvalifiserer som en ekstrem outlier.

  • Dele
instagram viewer