Många högskoleprogram kräver statistik. Ett nyckelbegrepp som presenteras i en typisk statistikklass är normalfördelningen av data eller en klockkurva. Att förstå hur man tolkar en uppsättning data som faller i en naturlig fördelning gör det möjligt att förstå vetenskapliga studier. Skaffa en god förståelse för klockkurvan, medelvärdet, standardavvikelser och deras förhållande till percentiler för att bli bekant med den vetenskapliga forskningens språk.
Normalfördelning och klockkurvan
När många typer av naturligt förekommande data som höjd , intelligenskvoter och blodtryck plottas på ett histogram, där poängen är på den horisontella axeln och förekomsterna eller antalet poäng är på den vertikala axeln, faller data in i ett klockformat mönster som kallas en klockkurva. Detta mönster, känt som en normalfördelning, lämpar sig för statistisk analys.
Medelvärdet and Median
Medelmedelvärdet av alla poäng kommer att falla ungefär vid mitten av klockkurvan. Medelvärdet representerar den 50:e percentilen, där hälften av alla poäng ligger över det måttet och hälften ligger under. I normalfördelade data kommer medianpoängen också att falla i mitten av klockkurvan, vilket representerar flest förekomster.
Standardavvikelser och varians
Hur långt bort från medelvärdet är ett mått? I normalfördelade uppsättningar data kan ett mått beskrivas som ett visst antal standardavvikelser bort från medelvärdet. En standardavvikelse är ett mått på varians, eller hur spridda eller spridda data är från medelvärdet. Om mått har stor varians sprids klockkurvan ut; om de har liten varians är klockkurvan smal. Ju fler standardavvikelser bort poängen är, desto mindre sannolikt är poängen att den inträffar i naturen.
Percentiler och den empiriska regeln
När man tittar på en klockkurva ligger 68 % av måtten inom en standard medelvärdets avvikelse. 95 % av fördelningen ligger inom två standardavvikelser från medelvärdet. Hela 99,7 % av åtgärderna faller inom tre standardavvikelser från det. Dessa procentsatser, som kallas den empiriska regeln, är grunden för statistisk analys av naturligt förekommande fenomen. Om en medicinsk forskare, till exempel, finner att en grupp som tog en viss medicin för att kontrollera kolesterol nu har mått på kolesterol två standardavvikelser från medelvärdet, skulle det knappast inträffa av en slump.