Linjär regression och multipel linjär regressionsanalys

Linjär regression är en statistisk teknik som används för att lära sig mer om sambandet mellan en oberoende (prediktor) variabel och en beroende (kriterium) variabel. När du har fler än en oberoende variabel i din analys, kallas detta multipel linjär regression. I allmänhet tillåter regression forskaren att ställa den allmänna frågan ”Vad är den bästa prediktorn för…?”

Låt oss till exempel säga att vi studerade orsakerna till fetma, mätt med kroppsmassaindex (BMI). Vi ville särskilt se om följande variabler var signifikanta prediktorer för en persons BMI: antal snabbmatsmåltider som äts per vecka, antal timmar tittade på tv per vecka, antal minuter som ägnas åt att träna per vecka och föräldrars BMI. Linjär regression skulle vara en bra metod för denna analys.

Regressionsekvationen

När du gör en regressionsanalys med en oberoende variabel är regressionsekvationen Y = a + b*X där Y är den beroende variabeln, X är den oberoende variabeln, a är konstanten (eller skärningen) , och b är lutningen på regressionslinjen. Låt oss till exempel säga att GPA bäst förutsägs av regressionsekvationen 1 + 0,02*IQ. Om en elev hade en IQ på 130, då skulle hans eller hennes GPA vara 3,6 ( 1 + 0,02*130 = 3,6).

När du är kondu Om du använder en regressionsanalys där du har mer än en oberoende variabel, är regressionsekvationen Y = a + b1*X1 + b2*X2 + … +bp*Xp. Om vi ​​till exempel ville inkludera fler variabler i vår GPA-analys, såsom mått på motivation och självdisciplin, skulle vi använda denna ekvation.

R-Square

R-kvadrat, även känd som bestämningskoefficienten, är en vanlig statistik för att utvärdera modellanpassningen av en regressionsekvation. Det vill säga, hur bra är alla dina oberoende variabler på att förutsäga din beroende variabel? Värdet på R-kvadrat varierar från 0,0 till 1,0 och kan multipliceras med 100 för att få en förklarad varians i procent. Till exempel, att gå tillbaka till vår GPA-regressionsekvation med bara en oberoende variabel (IQ)… Låt oss säga att vår R-kvadrat för ekvationen var 0,4. Vi skulle kunna tolka detta som att 40 % av variansen i GPA förklaras av IQ. Om vi ​​sedan lägger till våra andra två variabler (motivation och självdisciplin) och R-kvadraten ökar till 0,6 betyder det att IQ, motivation och självdisciplin tillsammans förklarar 60% av variansen i GPA-poäng.

Regressionsanalyser görs vanligtvis med hjälp av statistisk programvara, såsom SPSS eller SAS och så beräknas R-kvadraten åt dig.

Tolka regressionskoefficienterna (b)

b-koefficienterna från ekvationerna ovan representerar styrkan och riktningen för sambandet mellan de oberoende och beroende variablerna. Om vi ​​tittar på GPA- och IQ-ekvationen, 1 + 0,02*130 = 3,6, är 0,02 regressionskoefficienten för variabeln IQ. Detta säger oss att riktningen för relationen är positiv så att när IQ ökar, ökar också GPA. Om ekvationen var 1 – 0,02*130 = Y, så skulle detta betyda att sambandet mellan IQ och GPA var negativt.

Antaganden

Det finns flera antaganden om data som måste uppfyllas för att göra en linjär regressionsanalys:

Linjäritet: Det antas att sambandet mellan de oberoende och beroende variablerna är linjär. Även om detta antagande aldrig kan bekräftas fullt ut, kan en titt på ett spridningsdiagram av dina variabler hjälpa till att göra denna bestämning. Om en krökning i förhållandet finns kan du överväga att transformera variablerna eller uttryckligen tillåta icke-linjära komponenter.

 

Normalitet: Det antas att residualerna av dina variabler är normalfördelade. Det vill säga att felen i förutsägelsen av värdet på Y (den beroende variabeln) fördelas på ett sätt som närmar sig normalkurvan. Du kan titta på histogram eller normala sannolikhetsdiagram för att inspektera fördelningen av dina variabler och deras restvärden.

 

Oberoende: Det antas att felen i förutsägelsen av värdet på Y alla är oberoende av varandra (ej korrelerade).

Homoskedasticitet:  Det antas att variansen runt regressionslinjen är samma för alla värden för de oberoende variablerna.

 

 

Källa

 

StatSoft: Elektronisk statistik lärobok. (2011). http://www.statsoft.com/textbook/basic-statistics/#Crosstabulationb.

 

Lämna ett svar

Relaterade Inlägg

  • Hamlet – Karaktärsanalys och relationer

  • Sammanfattning av ”Othello” akt tre, scener 1-3

  • ”Othello” Akt 2 Sammanfattning

  • ”Othello” akt 5, scen 2

  • Karaktärsanalys: Kung Lear

  • Akt 4, Scen 6 Analys