När det kommer till vetenskapliga studier är urvalsstorleken en avgörande faktor för kvalitetsforskning. Urvalsstorlek, ibland representerad som n, är antalet enskilda data som används för att beräkna en uppsättning statistik. Större urvalsstorlekar gör det möjligt för forskare att bättre fastställa medelvärdena för sina data och undvika fel från att testa ett litet antal möjligen atypiska prover.
TL;DR (För lång, läste inte)
Provstorlek är en viktig faktor för forskning. Större urvalsstorlekar ger mer exakta medelvärden, identifierar extremvärden som kan skeva data i ett mindre urval och ger en mindre felmarginal.
Provstorlek
Provstorlek är antalet uppgifter testas i en undersökning eller ett experiment. Om du till exempel testar 100 prover av havsvatten för oljerester, är din provstorlek 100. Om du undersöker 20 000 personer för tecken på ångest är ditt urvalsstorlek 20 000. Större provstorlekar har den uppenbara fördelen att de tillhandahåller mer data för forskare att arbeta med; men experiment i stor provstorlek kräver större ekonomiska och tidsmässiga åtaganden.
Mean Value and Outliers
Större provstorlekar hjälper till att bestämma medelvärdet av en kvalitet bland testade prover — detta medelvärde är medelvärdet. Ju större urvalsstorlek, desto mer exakt medelvärde. Om du till exempel upptäcker att medelhöjden bland 40 personer är 5 fot, 4 tum, men bland 100 personer är medelhöjden 5 fot, 3 tum, är det andra måttet en bättre uppskattning av medelhöjden för en individuellt, eftersom du testar betydligt fler ämnen. Genom att bestämma medelvärdet kan forskare också lättare peka ut outliers. En extremvärde är en databit som skiljer sig starkt från medelvärdet och kan representera en intressepunkt för forskning. Så baserat på medelhöjden skulle någon med en höjd på 6 fot, 8 tum, vara en avlägsen datapunkt.
Faran med små prover
Möjligheten för extremvärden är en del av det som gör stor urvalsstorlek viktig. Säg till exempel att du undersöker fyra personer om deras politiska tillhörighet och att en tillhör det oberoende partiet. Eftersom detta är en individ i en urvalsstorlek på 4 kommer din statistik att visa att 25 procent av befolkningen tillhör den oberoende parten, troligen en felaktig extrapolering. Genom att öka ditt urvalsstorlek undviker du vilseledande statistik om det finns en extremvärde i ditt urval.
Felmarginal
Provstorlek är direkt relaterad till en statistiks felmarginal, eller hur korrekt en statistik kan beräknas vara. För en ja-eller-nej-fråga, till exempel om en person äger en bil, kan du bestämma felmarginalen för en statistik genom att dividera 1 med kvadratroten av urvalsstorleken och och multiplicera med 100. Summan är en procentsats . Till exempel kommer en urvalsstorlek på 100 att ha en felmarginal på 10 procent. När du mäter numeriska kvaliteter med ett medelvärde, såsom längd eller vikt, multiplicera denna summa med två gånger standardavvikelsen för data, vilket mäter hur utspridda datavärdena är från betyda. I båda fallen gäller att ju större urvalsstorleken är, desto mindre är felmarginalen.