Hur man hittar medelvärde, median, läge, intervall och standardavvikelse

Förenkla jämförelser av antal uppsättningar, särskilt stora uppsättningar av tal, genom att beräkna mittvärdena med medelvärde, läge och median. Använd intervallen och standardavvikelserna för uppsättningarna för att undersöka variabiliteten i data.

Medelvärdet identifierar medelvärdet för uppsättningen siffror. Tänk till exempel på datamängden som innehåller värdena 20, 24, 25, 36, 25, 22, 23.

För att hitta medelvärdet, använd formeln: Medel är lika med summan av siffrorna i datamängden dividerat med antalet värden i datamängden. I matematiska termer:

\ text {Mean} = \ frac {\ text {summa av alla termer}} {\ text {hur många termer eller värden i uppsättningen}}

Medianen identifierar mittpunkten eller mittvärdet för en uppsättning siffror.

Sätt siffrorna i ordning från minsta till största. Använd exempeluppsättningen värden: 20, 24, 25, 36, 25, 22, 23. Placerad i ordning blir uppsättningen: 20, 22, 23, 24, 25, 25, 36.

Om taluppsättningen har ett jämnt antal värden, beräknar du medelvärdet av de två mittvärdena. Antag till exempel att siffran innehåller värdena 22, 23, 25, 26. Mitten ligger mellan 23 och 25. Lägga till 23 och 25 ger 48. Att dela 48 med två ger ett medianvärde på 24.

Läget identifierar det eller de vanligaste värdena i datamängden. Beroende på data kan det finnas ett eller flera lägen eller inget läge alls.

Som att hitta medianen, beställ datamängden från minsta till största. I exempeluppsättningen blir de ordnade värdena: 20, 22, 23, 24, 25, 25, 36.

Ett läge inträffar när värdena upprepas. I exempeluppsättningen förekommer värdet 25 två gånger. Inga andra siffror upprepas. Därför är läget värdet 25.

I vissa datamängder förekommer mer än ett läge. Datauppsättningen 22, 23, 23, 24, 27, 27, 29 innehåller två lägen, ett vardera vid 23 och 27. Andra datamängder kan ha mer än två lägen, kan ha lägen med mer än två siffror (som 23, 23, 24, 24, 24, 28, 29: läge är lika med 24) eller kanske inte har några lägen alls (som 21, 23, 24, 25, 26, 27, 29). Läget kan förekomma var som helst i datamängden, inte bara i mitten.

Område visar det matematiska avståndet mellan de lägsta och högsta värdena i datamängden. Räckvidd mäter datamängds variation. Ett brett intervall indikerar större variation i data, eller kanske en enda outlier långt från resten av data. Outliers kan snedvrida eller skifta medelvärdet tillräckligt för att påverka dataanalysen.

I provuppsättningen överstiger det höga datavärdet 36 det tidigare värdet, 25, med 11. Detta värde verkar extremt, med tanke på de andra värdena i uppsättningen. Värdet på 36 kan vara en avvikande datapunkt.

Standardavvikelse mäter datamängdsvariabiliteten. Liksom intervall indikerar en mindre standardavvikelse mindre variation.

Att hitta standardavvikelse kräver summering av den kvadratiska skillnaden mellan varje datapunkt och medelvärdet [∑ (x​ − ​µ​)2], lägga till alla kvadrater och dela summan med en mindre än antalet värden (N- 1) och slutligen beräkna kvadratroten av utdelningen. I en formel är detta:

Beräkna medelvärdet genom att lägga till alla datapunktsvärden och sedan dividera med antalet datapunkter. I provdatamängden,

Dela summan, 175, med antalet datapunkter, 7 eller

Därefter subtraherar du medelvärdet från varje datapunkt och kvadrerar sedan varje skillnad. Formeln ser ut så här:

där ∑ betyder summa,xi representerar varje datasatsvärde ochµrepresenterar medelvärdet. Fortsatt med exempeluppsättningen blir värdena:

20-25 = -5 \ text {och} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {och} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {och} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {och} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {och} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {och} -3 ^ 2 = 9 \\ 23- 25 = -2 \ text {och} -2^2=4

Dela summan av de kvadratiska skillnaderna med en mindre än antalet datapunkter. Exempeldatamängden har 7 värden, såN- 1 är lika med 7 - 1 = 6. Summan av kvadratiska skillnader, 160, dividerat med 6 motsvarar ungefär 26,6667.

Beräkna standardavvikelsen genom att hitta kvadratroten av divisionen medN− 1. I exemplet är kvadratroten på 26.6667 lika med cirka 5.164. Därför är standardavvikelsen lika med cirka 5,164.

Standardavvikelse hjälper till att utvärdera data. Siffror i datamängden som faller inom en standardavvikelse av medelvärdet är en del av datamängden. Tal som faller utanför två standardavvikelser är extrema värden eller outliers. I exempeluppsättningen ligger värdet 36 mer än två standardavvikelser från medelvärdet, så 36 är en outlier. Avvikare kan representera felaktiga uppgifter eller kan föreslå oförutsedda omständigheter och bör övervägas noga när de tolkar data.

  • Dela med sig
instagram viewer