Provets standardavvikelse är en beskrivande statistik som mäter spridningen av en kvantitativ datamängd. Detta tal kan vara vilket icke-negativt reellt tal som helst. Eftersom noll är ett icke-negativt tal. verkligt tal, verkar det vara värt att fråga, ”När kommer provets standardavvikelse att vara lika med noll?” Detta inträffar i det mycket speciella och mycket ovanliga fallet när alla våra datavärden är exakt desamma. Vi kommer att undersöka orsakerna till detta.
Beskrivning av standardavvikelsen
Två viktiga frågor som vi vanligtvis vill besvara om en datamängd inkluderar:
Vad är mitten av datamängden?
Hur spridd är datauppsättningen?
Det finns olika mätningar, så kallade beskrivande statistik som svarar på dessa frågor. Till exempel kan mitten av data, även känd som genomsnittet, beskrivas i termer av medelvärde, median eller läge. Annan statistik, som är mindre känd, kan användas såsom mittgångjärn eller trimean.
För spridningen av våra data kan vi använda intervallet, det interkvartila intervallet eller standardavvikelsen. Standardavvikelsen är parad med medelvärdet för att kvantifiera spridningen av vår data. Vi kan sedan använda detta nummer för att jämföra flera datamängder. Ju större vår standardavvikelse är, desto större är spridningen.
Intuition
Så låt oss från denna beskrivning överväga vad det skulle innebära att ha en standardavvikelse på noll. Detta skulle tyda på att det inte finns någon spridning alls i vår datamängd. Alla individuella datavärden skulle klumpas ihop till ett enda värde. Eftersom det bara skulle finnas ett värde som våra data skulle kunna ha, skulle detta värde utgöra medelvärdet av vårt urval.
I den här situationen, när alla våra datavärden är desamma, skulle det inte finnas någon som helst variation. Intuitivt är det vettigt att standardavvikelsen för en sådan datamängd skulle vara noll.
Matematiskt bevis
Provets standardavvikelse definieras av en formel. Så varje påstående som det ovan bör bevisas genom att använda denna formel. Vi börjar med en datamängd som passar beskrivningen ovan: alla värden är identiska, och det finns
n
värden lika med
x.
Vi beräknar medelvärdet av denna datamängd och ser att det är
x
= (
x
+
x
+ . . . +
x
)/
n
=
nx/
n
=
x.
När vi nu beräknar de individuella avvikelserna från medelvärdet ser vi att alla dessa avvikelserna är noll. Följaktligen är variansen och även standardavvikelsen båda lika med noll också.
Nödvändigt och tillräckligt
Vi ser att om datamängden visar ingen variation, då är dess standardavvikelse noll. Vi kan fråga om motsatsen till detta uttalande också är sant. För att se om det är det kommer vi att använda formeln för standardavvikelse igen. Den här gången kommer vi dock att sätta standardavvikelsen lika med noll. Vi kommer inte att göra några antaganden om vår datamängd, men kommer att se vilken inställning
s
= 0 innebär
Antag att standardavvikelsen för en datamängd är lika med noll. Detta skulle innebära att urvalsvariansen
s2
är också lika med noll. Resultatet är ekvationen:
0 = (1/ (
n – 1)) ∑ (
xi
–
x )
2
Vi multiplicerar båda sidor av ekvationen med n
– 1 och se att summan av de kvadratiska avvikelserna är lika med noll . Eftersom vi arbetar med reella tal, är det enda sättet för detta att inträffa att var och en av de kvadratiska avvikelserna är lika med noll. Detta betyder att för varje
i, termen (
xi
–
x
)2 = 0.
Vi tar nu kvadratroten ur ekvationen ovan och ser att varje avvikelse från medelvärdet måste vara lika med noll. Eftersom för alla
i
,
x
i –
x
= 0
Detta betyder att varje datavärde är lika med medelvärdet. Detta resultat tillsammans med det ovan låter oss säga att provets standardavvikelse för en datamängd är noll om och endast om alla dess värden är identiska.