När man överväger standardavvikelser kan det komma som en överraskning att det faktiskt finns två som kan övervägas. Det finns en populationsstandardavvikelse och det finns ett urval av standardavvikelser Vi kommer att skilja mellan de två av dessa och belysa deras skillnader
Kvalitativa skillnader
Även om båda standardavvikelserna mäter variabilitet, finns det skillnader mellan en population och ett urvalsstandardavvikelse. Den första har att göra med distinktionen mellan statistik och parametrar. populationens standardavvikelse är en parameter, som är ett fast värde som beräknas från varje individ i populationen.
En stickprovsstandardavvikelse är en statistik. Det betyder att den beräknas från endast några av individerna i en population Standardavvikelsen beror på provet, den har större variation. Således är standardavvikelsen för urvalet större än för populationen.
Kvantitativ skillnad
Vi kommer att se hur dessa två typer av standardavvikelser skiljer sig från varandra numeriskt. För att göra detta överväger vi formlerna för både urvalets standardavvikelse och populationens standardavvikelse.
Formlerna för att beräkna båda dessa standardavvikelser är nästan identiska:
Kvadratera var och en av avvikelserna.
Nu skiljer sig beräkningen av dessa standardavvikelser:
- Om vi beräknar populationens standardavvikelse, så dividerar vi med n,
antalet datavärden.
- Om vi beräknar provets standardavvikelse, dividerar vi med
n
-1, ett mindre än antalet datavärden.
Den fi Det sista steget, i något av de två fallen som vi överväger, är att ta kvadratroten av kvoten från föregående steg. Ju större värdet av n
är, desto närmare kommer populationen och urvalets standardavvikelser.
Beräkningsexempel
För att jämföra dessa två beräkningar börjar vi med samma datamängd: 1, 2, 4, 5, 8
Därefter utför vi alla steg som är gemensamma för båda beräkningarna. Efter detta kommer beräkningarna att avvika från varandra och vi kommer att skilja mellan populationens och urvalets standardavvikelser.
Medelvärdet är (1 + 2 + 4 + 5 + 8 ) / 5 = 20/5 =4.
Avvikelserna hittas genom att subtrahera medelvärdet från varje värde:
Avvikelserna i kvadrat är följande:
(-3)2 = 9
= 4
1
2 = 1= 16
Vi addera nu dessa kvadratiska avvikelser och se att deras summa är 9 + 4 + 0 + 1 + 16 = 30.
I vår första beräkning kommer vi att behandla våra data som om det är hela populationen. Vi dividerar med antalet datapunkter, vilket är fem. Det betyder att populationsvariansen är 30/5 = 6. Populationens standardavvikelse är kvadratroten ur 6. Detta är ungefär 2,4495.