I statistik avser termen robusthet eller robusthet styrkan hos en statistisk modell, tester och procedurer enligt de specifika villkoren för den statistiska analys som en studie hoppas kunna Med tanke på att dessa villkor för en studie är uppfyllda, kan modellerna verifieras att de är sanna genom att använda matematiska bevis
Många modeller är baserade på idealiska situationer som inte gör det. existerar när man arbetar med verkliga data, och som ett resultat kan modellen ge korrekta resultat även om villkoren inte är uppfyllda exakt.
Robust statistik är därför all statistik som ger bra prestanda när data hämtas från ett brett spektrum av sannolikhetsfördelningar som i stort sett är opåverkade av extremvärden eller små avvikelser från modellantaganden i en given datamängd. Med andra ord är en robust statistik resistent till fel i resultaten.
Ett sätt att observera en allmänt hållen robust statistisk procedur, man behöver inte leta längre än t-procedurer, som använder hypotestest för att bestämma de mest exakta statistiska förutsägelserna.
Att observera T-procedurer För ett exempel på robusthet kommer vi att överväga t-procedurer, som inkluderar konfidensintervallet för ett populationsmedelvärde med okänd populationsstandardavvikelse samt hypotestest om populationsmedelvärdet. Användningen av t-
procedurer förutsätter följande:
Den uppsättning data som vi arbetar med är ett enkelt slumpmässigt urval av populationen.
Populationen som vi har tagit prov från är normalfördelad. I praktiken med verkliga exempel har statistiker sällan en befolkning som är normalfördelad, så frågan blir istället ”Hur robusta är våra t-
rutiner?”
Generellt sett är villkoret att vi har ett enkelt slumpmässigt urval viktigare än villkoret att vi har tagit ett urval från en normalfördelad befolkning; Anledningen till detta är att den centrala gränssatsen säkerställer en urvalsfördelning som är ungefär normal — ju större urvalsstorleken är, desto närmare är urvalsfördelningen för urvalsmedelvärdet att vara normal.
Hur T-procedurer fungerar som robust statistik
Så robusthet för t-procedurer beror på urvalets storlek och fördelningen av vårt urval. Överväganden för detta inkluderar:
Om provstorleken är stor, vilket betyder att vi har 40 eller fler observationer, då t-
procedurer kan användas även med distributioner som är skeva.
Om urvalsstorleken är mellan 15 och 40 kan vi använda t-
procedurer för valfri formfördelning, såvida det inte finns extremvärden eller en hög grad av skevhet.
Om urvalsstorleken är mindre än 15 kan vi använda t
– procedurer för data som inte har några extremvärden, en enda topp och är nästan symmetriska. I de flesta fall har robusthet fastställts genom teknisk arbeta med matematisk statistik, och lyckligtvis behöver vi inte nödvändigtvis göra dessa avancerade matematiska beräkningar för att kunna använda dem på rätt sätt; vi behöver bara förstå vad de övergripande riktlinjerna är för robustheten hos vår specifika statistiska metod.
T-procedurer fungerar som robust statistik eftersom de vanligtvis ger bra prestanda för dessa modeller genom att inkludera urvalets storlek i underlaget för att tillämpa förfarandet.
I de flesta fall har robusthet fastställts genom teknisk arbeta med matematisk statistik, och lyckligtvis behöver vi inte nödvändigtvis göra dessa avancerade matematiska beräkningar för att kunna använda dem på rätt sätt; vi behöver bara förstå vad de övergripande riktlinjerna är för robustheten hos vår specifika statistiska metod.
T-procedurer fungerar som robust statistik eftersom de vanligtvis ger bra prestanda för dessa modeller genom att inkludera urvalets storlek i underlaget för att tillämpa förfarandet.