Hur man hittar medelvärde, median, läge, intervall och standardavvikelse

Förenkla jämförelser av uppsättningar av tal, särskilt stora uppsättningar av tal, genom att beräkna mittvärdena med hjälp av medelvärde, läge och median. Använd intervallen och standardavvikelserna för uppsättningarna för att undersöka variabiliteten av data.

Beräknar medelvärde

Medelvärdet identifierar medelvärdet för uppsättningen siffror. Betrakta till exempel datamängden som innehåller värdena 20, 24, 25, 36, 25, 22, 23.

För att hitta medelvärdet, använd formeln: Medelvärde är lika med summan av talen i datamängden dividerat med antalet värden i datan uppsättning. I matematiska termer:

text{Mean}=frac{text{summan av alla termer}} {text{hur många termer eller värden i uppsättningen}}

Lägg till siffrorna i exempel på datauppsättning:

20+24+25+36+25+22+23=175

Dividera med antalet datapunkter i uppsättningen. Denna uppsättning har sju värden så dividera med 7.

Infoga värdena i formeln för att beräkna medelvärdet. Medelvärdet är lika med summan av värdena (175) dividerat med antalet datapunkter (7). Sedan

frac{175}{7}=25

medelvärdet av denna datamängd är lika med 25. Alla medelvärden är inte lika med ett heltal.

Beräknar median

Medianen identifierar mittpunkten eller mittvärdet av en uppsättning tal.

Sätt siffrorna i ordning från minsta till största. Använd exemplet med värden: 20, 24, 25, 36, 25, 22, 23. Placerad i ordning blir uppsättningen: 20, 22, 23, 24, 25, 25, 36.

Eftersom denna uppsättning tal har sju värden, är medianen eller värdet i mitten är 24.

Om uppsättningen siffror har ett jämnt antal värden, beräkna medelvärdet av de två mittvärdena. Anta till exempel att siffrorna innehåller värdena 22, 23, 25, 26. Mitten ligger mellan 23 och 25. Lägga till 23 och 25 ger 48. Att dividera 48 med två ger ett medianvärde på 24.

Beräkningsläge

Läget identifierar det eller de vanligaste värdena i datamängden. Beroende på data kan det finnas ett eller flera lägen, eller inget läge alls.

Som att hitta medianen, ordna datamängden från minsta till största. I exempeluppsättningen blir de ordnade värdena: 20, 22, 23, 24, 25, 25, 36.

Ett läge uppstår när värden upprepas. I exemplet uppträder värdet 25 två gånger. Inga andra siffror upprepas. Därför är läget värdet 25.

I vissa datamängder förekommer mer än ett läge. Datauppsättningen 22, 23, 23, 24, 27, 27, 29 innehåller två lägen, en vardera vid 23 och 27. Andra datamängder kan ha mer än två lägen, kan ha lägen med fler än två siffror (som 23, 23 , 24, 24, 24, 28, 29: läge är lika med 24) eller kanske inte har några lägen alls (som 21, 23, 24, 25, 26, 27, 29). Läget kan förekomma var som helst i datamängden, inte bara i mitten.

Beräknar intervall

Omfång visar det matematiska avståndet mellan de lägsta och högsta värdena i datamängden. Range mäter datauppsättningens variabilitet. Ett brett intervall indikerar större variation i data, eller kanske en enstaka extremvärde långt från resten av data. Outliers kan skeva, eller förskjuta, medelvärdet tillräckligt för att påverka dataanalysen.

I urvalsgruppen är det lägsta värdet 20 och det högsta värdet är 36 .

För att beräkna intervall, subtrahera det lägsta värdet från det högsta värdet. Sedan 36-20=16 intervallet är lika med 16.

I sampeluppsättningen överstiger det höga datavärdet på 36 det tidigare värdet, 25, med 11. Detta värde verkar extremt med tanke på de andra värdena i uppsättningen. Värdet på 36 kan vara en avvikande datapunkt.

Beräknar standardavvikelse

Standardavvikelse mäter datauppsättningens variabilitet. Precis som intervallet indikerar en mindre standardavvikelse mindre variation.

För att hitta standardavvikelsen krävs summering av den kvadratiska skillnaden mellan varje datapunkt och medelvärdet , lägga till alla kvadrater, dividera summan med en mindre än antalet värden (​N​ − 1), och slutligen beräkna kvadratroten av utdelningen. I en formel är detta:text{SD}= sqrt{frac{ sum_i{(x_i – mu)^2}}{N-1}}

Matematiskt, börja med att beräkna medelvärdet.

Beräkna medelvärdet genom att lägga till alla datapunktsvärden och sedan dividera med antalet datapunkter. I exempeldatauppsättningen,

20+24+25+36+25+22+23 =175

Dividera summan, 175, med antalet datapunkter, 7, eller frac{175}{7}=25

Medelvärdet är lika med 25.

Subtrahera sedan medelvärdet från varje datapunkt och kvadrera sedan varje skillnad. Formeln ser ut så här:

sum_i^N(x_i – mu)^2 där ∑ betyder summa, ​i representerar varje datamängdsvärde och ​µ

representerar medelvärdet. Om du fortsätter med exempeluppsättningen blir värdena:

20-25=-5 text{ och } -5^2=25 \ 24-25=-1 text{ och } -1^2=1 \ 25-25=0 text{ och } 0^2=0 \ 36-25= 11 text{ och } 11^2=121 \ 25-25=0 text{ och } 0^2=0 \ 22-25=-3 text{ och } -3^2=9 \ 23 -25=-2 text{ och } -2^2=4

Lägga till de kvadratiska skillnaderna ger:

25+1+0+121+0+9+4=160

Dividera summan av skillnaderna i kvadrat med en mindre än antalet datapunkter. Exempeldatauppsättningen har 7 värden, så ​N​ − 1 är lika med 7 − 1 = 6. Summan av skillnaderna i kvadrat, 160, dividerat med 6 är ungefär lika med 26,6667.

Beräkna standardavvikelsen genom att hitta kvadratroten av divisionen med ​− 1. I exemplet är kvadratroten ur 26,6667 ungefär 5,164. Därför är standardavvikelsen ungefär 5,164.

Standardavvikelse hjälper till att utvärdera data. Siffror i datamängden som faller inom en standardavvikelse från medelvärdet är en del av datamängden. Tal som faller utanför två standardavvikelser är extrema värden eller extremvärden. I exemplet ligger värdet 36 mer än två standardavvikelser från medelvärdet, så 36 är en extremvärde. Outliers kan representera felaktiga data eller kan antyda oförutsedda omständigheter och bör övervägas noggrant vid tolkning av data.

Lämna ett svar

Relaterade Inlägg

  • Hur man beräknar volymer av femkantiga prismor

  • Hur man konverterar omkrets till diameter på en miniräknare

  • Hur man testar Chi-Square

  • Vilka är några egenskaper hos protein?

  • Vad är Gaussisk distribution?

  • Hur man ritar en normalfördelning i Excel