Förenkla jämförelser av uppsättningar av tal, särskilt stora uppsättningar av tal, genom att beräkna mittvärdena med hjälp av medelvärde, läge och median. Använd intervallen och standardavvikelserna för uppsättningarna för att undersöka variabiliteten av data.
Beräknar medelvärde
Medelvärdet identifierar medelvärdet för uppsättningen siffror. Betrakta till exempel datamängden som innehåller värdena 20, 24, 25, 36, 25, 22, 23.
För att hitta medelvärdet, använd formeln: Medelvärde är lika med summan av talen i datamängden dividerat med antalet värden i datan uppsättning. I matematiska termer:
Lägg till siffrorna i exempel på datauppsättning:
Dividera med antalet datapunkter i uppsättningen. Denna uppsättning har sju värden så dividera med 7.
Infoga värdena i formeln för att beräkna medelvärdet. Medelvärdet är lika med summan av värdena (175) dividerat med antalet datapunkter (7). Sedan
medelvärdet av denna datamängd är lika med 25. Alla medelvärden är inte lika med ett heltal.
Beräknar median
Medianen identifierar mittpunkten eller mittvärdet av en uppsättning tal.
Sätt siffrorna i ordning från minsta till största. Använd exemplet med värden: 20, 24, 25, 36, 25, 22, 23. Placerad i ordning blir uppsättningen: 20, 22, 23, 24, 25, 25, 36.
Eftersom denna uppsättning tal har sju värden, är medianen eller värdet i mitten är 24.
Om uppsättningen siffror har ett jämnt antal värden, beräkna medelvärdet av de två mittvärdena. Anta till exempel att siffrorna innehåller värdena 22, 23, 25, 26. Mitten ligger mellan 23 och 25. Lägga till 23 och 25 ger 48. Att dividera 48 med två ger ett medianvärde på 24.
Beräkningsläge
Läget identifierar det eller de vanligaste värdena i datamängden. Beroende på data kan det finnas ett eller flera lägen, eller inget läge alls.
Som att hitta medianen, ordna datamängden från minsta till största. I exempeluppsättningen blir de ordnade värdena: 20, 22, 23, 24, 25, 25, 36.
Ett läge uppstår när värden upprepas. I exemplet uppträder värdet 25 två gånger. Inga andra siffror upprepas. Därför är läget värdet 25.
I vissa datamängder förekommer mer än ett läge. Datauppsättningen 22, 23, 23, 24, 27, 27, 29 innehåller två lägen, en vardera vid 23 och 27. Andra datamängder kan ha mer än två lägen, kan ha lägen med fler än två siffror (som 23, 23 , 24, 24, 24, 28, 29: läge är lika med 24) eller kanske inte har några lägen alls (som 21, 23, 24, 25, 26, 27, 29). Läget kan förekomma var som helst i datamängden, inte bara i mitten.
Beräknar intervall
Omfång visar det matematiska avståndet mellan de lägsta och högsta värdena i datamängden. Range mäter datauppsättningens variabilitet. Ett brett intervall indikerar större variation i data, eller kanske en enstaka extremvärde långt från resten av data. Outliers kan skeva, eller förskjuta, medelvärdet tillräckligt för att påverka dataanalysen.
I urvalsgruppen är det lägsta värdet 20 och det högsta värdet är 36 .
För att beräkna intervall, subtrahera det lägsta värdet från det högsta värdet. Sedan 36-20=16 intervallet är lika med 16.
I sampeluppsättningen överstiger det höga datavärdet på 36 det tidigare värdet, 25, med 11. Detta värde verkar extremt med tanke på de andra värdena i uppsättningen. Värdet på 36 kan vara en avvikande datapunkt.
Beräknar standardavvikelse
Standardavvikelse mäter datauppsättningens variabilitet. Precis som intervallet indikerar en mindre standardavvikelse mindre variation.
För att hitta standardavvikelsen krävs summering av den kvadratiska skillnaden mellan varje datapunkt och medelvärdet , lägga till alla kvadrater, dividera summan med en mindre än antalet värden (N − 1), och slutligen beräkna kvadratroten av utdelningen. I en formel är detta:text{SD}= sqrt{frac{ sum_i{(x_i – mu)^2}}{N-1}}
Matematiskt, börja med att beräkna medelvärdet.
Beräkna medelvärdet genom att lägga till alla datapunktsvärden och sedan dividera med antalet datapunkter. I exempeldatauppsättningen,
Dividera summan, 175, med antalet datapunkter, 7, eller frac{175}{7}=25
Medelvärdet är lika med 25.
Subtrahera sedan medelvärdet från varje datapunkt och kvadrera sedan varje skillnad. Formeln ser ut så här:
representerar medelvärdet. Om du fortsätter med exempeluppsättningen blir värdena:
Lägga till de kvadratiska skillnaderna ger:
Dividera summan av skillnaderna i kvadrat med en mindre än antalet datapunkter. Exempeldatauppsättningen har 7 värden, så N − 1 är lika med 7 − 1 = 6. Summan av skillnaderna i kvadrat, 160, dividerat med 6 är ungefär lika med 26,6667.
Beräkna standardavvikelsen genom att hitta kvadratroten av divisionen med N − 1. I exemplet är kvadratroten ur 26,6667 ungefär 5,164. Därför är standardavvikelsen ungefär 5,164.
Standardavvikelse hjälper till att utvärdera data. Siffror i datamängden som faller inom en standardavvikelse från medelvärdet är en del av datamängden. Tal som faller utanför två standardavvikelser är extrema värden eller extremvärden. I exemplet ligger värdet 36 mer än två standardavvikelser från medelvärdet, så 36 är en extremvärde. Outliers kan representera felaktiga data eller kan antyda oförutsedda omständigheter och bör övervägas noggrant vid tolkning av data.