Hur man hittar Chi-Square statistiska funktioner i Excel

Statistik är ett ämne med ett antal sannolikhetsfördelningar och formler. Historiskt sett var många av beräkningarna med dessa formler ganska tråkiga. Värdetabeller genererades för några av de mer vanliga distributioner och de flesta läroböcker skriver fortfarande ut utdrag av dessa tabeller i bilagor. Även om det är viktigt att förstå det konceptuella ramverket som fungerar bakom kulisserna för en viss värdetabell, kräver snabba och korrekta resultat användning av statistisk programvara.

Det finns ett antal statistiska programvarupaket. Ett som vanligtvis används för beräkningar i inledningen är Microsoft Excel. Många distributioner är programmerade i Excel. En av dessa är chi-kvadratfördelningen Det finns flera Excel-funktioner som använder chi-kvadratfördelningen

De tails of Chi-square

Innan vi ser vad Excel kan göra, låt oss påminna oss om några detaljer om chi-kvadratfördelningen. Detta är en sannolikhetsfördelning som är asymmetrisk och mycket sned åt höger. Värden för fördelningen är alltid icke-negativa. Det finns faktiskt ett oändligt antal chi-kvadratfördelningar. Den som vi är särskilt intresserade av bestäms av antalet frihetsgrader som vi har i vår ansökan. Ju fler frihetsgrader desto mindre skev blir vår chi-kvadratfördelning.

Användning av chi-kvadrat

    En chi-kvadratfördelning används för flera applikationer. Dessa inkluderar:

    • Chi-square-test – för att avgöra om nivåerna av två kategoriska variabler är oberoende av varandra.
    • Test för passform—För att bestämma hur väl observerade värden för en enskild kategorisk variabel matchar med värden som förväntas av en teoretisk modell.
    • Multinomexperiment—Detta är en specifik användning av ett chi-kvadrattest.

    Alla dessa applikationer kräver att vi använder en chi-kvadratfördelning. Programvara är oumbärlig för beräkningar av denna distribution.

    CHISQ.DIST och CHISQ.DIST.RT i Excel

    Det finns flera funktioner i Excel som vi kan använda när vi handlar med chi-kvadratfördelningar. Den första av dessa är CHISQ.DIST. Denna funktion returnerar den vänstersvansade sannolikheten för den indikerade chi-kvadratfördelningen. Funktionens första argument är det observerade värdet av chi-kvadratstatistiken. Det andra argumentet är antalet frihetsgrader. Det tredje argumentet används för att få en kumulativ fördelning.

    Nära besläktad med CHISQ.DIST är CHISQ.DIST.RT. Denna funktion returnerar den högersidiga sannolikheten för den valda chi-kvadratfördelningen. Det första argumentet är det observerade värdet av chi-kvadratstatistiken, och det andra argumentet är antalet frihetsgrader.

    Om du till exempel anger =CHISQ.DIST(3, 4, true) i en cell matas ut 0,442175 . Detta betyder att för chi-kvadratfördelningen med fyra frihetsgrader, ligger 44,2175 % av arean under kurvan till vänster om 3. Om du anger =CHISQ.DIST.RT(3, 4 ) i en cell matas ut 0,557825. Det betyder att för chi-kvadratfördelningen med fyra frihetsgrader ligger 55,7825 % av arean under kurvan till höger om 3.

    För alla värden av argumenten, CHISQ.DIST.RT(x, r) = 1 – CHISQ.DIST(x, r, true). Detta beror på att den del av fördelningen som inte ligger till vänster om ett värde x måste ligga till höger.

    CHISQ.INV

    Ibland börjar vi med ett område för en viss chi-kvadratfördelning. Vi vill veta vilket värde av en statistik vi skulle behöva för att ha detta område till vänster eller höger om statistiken. Detta är ett omvänt chi-kvadratproblem och är användbart när vi vill veta det kritiska värdet för en viss nivå av signifikans. Excel hanterar denna typ av problem genom att använda en invers chi-kvadratfunktion.

    Funktionen CHISQ.INV returnerar inversen av den vänstersvansade sannolikheten för en chi-kvadratfördelning med specificerade frihetsgrader. Det första argumentet för denna funktion är sannolikheten till vänster om det okända värdet. Det andra argumentet är antalet frihetsgrader.

    Ange alltså till exempel =CHISQ.INV(0,442175, 4 ) in i en cell ger en utdata på 3. Notera hur detta är inversen av beräkningen vi tittade på tidigare angående CHISQ.DIST-funktionen. I allmänhet, om P

    = CHISQ.DIST(

    x

    , r

    ), sedan x = CHISQ.INV( P

    , r

    ).

    Nära relaterad till detta är CHISQ.INV.RT-funktionen. Detta är samma sak som CHISQ.INV, med undantaget att det handlar om högerstjärtade sannolikheter. Denna funktion är särskilt användbar för att bestämma det kritiska värdet för ett givet chi-kvadrattest. Allt vi behöver göra är att ange signifikansnivån som vår högersidiga sannolikhet och antalet frihetsgrader.

    Excel 2007 och Tidigare

    Tidigare versioner av Excel använder lite olika funktioner för att arbeta med chi-square. Tidigare versioner av Excel hade bara en funktion för att direkt beräkna högersidiga sannolikheter. Så CHIDIST motsvarar den nyare CHISQ.DIST.RT. På liknande sätt motsvarar CHIINV CHI.INV.RT.

Lämna ett svar

Relaterade Inlägg

  • The Notorious Benedict Arnold av Steve Sheinkin

  • En recension av Diary of a Wimpy Kid: Rodrick Rules

  • Mother Goose Board Böcker för spädbarn och småbarn

  • Bokrecension: The Librarian of Basra

  • The Magic Tree House-bokserien av Mary Pope Osborne

  • The Strange Case of Origami Yoda: Bokrecension