Hierarkisk regression är en statistisk metod för att utforska sambanden mellan, och testa hypoteser om, en beroende variabel och flera oberoende variabler. Linjär regression kräver en numerisk beroende variabel. De oberoende variablerna kan vara numeriska eller kategoriska. Hierarkisk regression innebär att de oberoende variablerna inte läggs in i regressionen samtidigt, utan i steg. Till exempel kan en hierarkisk regression undersöka sambanden mellan depression (såsom mätt med någon numerisk skala) och variabler inklusive demografi (som ålder, kön och etnisk grupp) i det första steget och andra variabler (som poäng på andra tester) i ett andra steg.
Tolka det första steget av regressionen.
Titta på den ostandardiserade regressionskoefficienten (som kan kallas B på din utdata) för varje oberoende variabel. För kontinuerliga oberoende variabler representerar detta förändringen i den beroende variabeln för varje enhetsändring i den oberoende variabeln. I exemplet, om ålder hade en regressionskoefficient på 2,1, skulle det betyda att det förutsagda värdet av depression ökar med 2,1 enheter för varje åldersår.
För kategoriska variabler bör utdata visa en regressionskoefficient för varje nivå av variabeln utom en; den som saknas kallas referensnivån. Varje koefficient representerar skillnaden mellan den nivån och referensnivån på den beroende variabeln. I exemplet, om den etniska referensgruppen är ”Vit” och den ostandardiserade koefficienten för ”Svart” är -1,2, skulle det betyda att det förväntade värdet av depression för svarta är 1,2 enheter lägre än för vita.
Titta på de standardiserade koefficienterna (som kan vara märkta med den grekiska bokstaven beta). Dessa kan tolkas på samma sätt som de ostandardiserade koefficienterna, bara de är nu i termer av standardavvikelseenheter för den oberoende variabeln, snarare än råenheter. Detta kan hjälpa till att jämföra de oberoende variablerna med varandra.
Titta på signifikansnivåerna, eller p-värden, för varje koefficient (dessa kan vara märkta ”Pr >” eller något liknande). Dessa talar om för dig om den associerade variabeln är statistiskt signifikant. Detta har en mycket speciell innebörd som ofta felaktigt framställs. Det betyder att en så hög eller högre koefficient i ett urval av denna storlek sannolikt inte skulle inträffa om den verkliga koefficienten, i hela populationen från vilken denna hämtas, var 0.
Titta på R i kvadrat. Detta visar hur stor andel av variationen i den beroende variabeln som modellen står för.
Tolka senare stadier av regressionen, förändringen och det övergripande resultatet
Upprepa ovanstående för varje senare steg av regressionen.
Jämför de standardiserade koefficienterna, ostandardiserade koefficienter, signifikansnivåer och r-kvadrater i varje steg till föregående steg. Dessa kan vara i separata sektioner av utdata eller i separata kolumner i en tabell. Den här jämförelsen låter dig veta hur variablerna i det andra (eller senare) steget påverkar relationerna i det första steget.
Titta på hela modellen, inklusive alla stadier. Titta på de ostandardiserade och standardiserade koefficienterna och signifikansnivåerna för varje variabel och R i kvadrat för hela modellen.
Varningar
Detta är ett mycket komplext ämne.