Ett av många sätt som variabler i statistik kan klassificeras på är att överväga skillnaderna mellan förklarings- och svarsvariabler. Även om dessa variabler är relaterade finns det viktiga skillnader mellan Efter att ha definierat dessa typer av variabler kommer vi att se att den korrekta identifieringen av dessa variabler har en direkt inverkan på andra aspekter av statistik, såsom konstruktionen av en punktdiagram och lutningen på en regressionslinje.
Definitioner av förklaring och svar
Vi börjar med att titta på definitionerna av dessa typer av variabler. En svarsvariabel är en viss kvantitet som vi ställer en fråga om i vår studie. En förklaringsvariabel är vilken faktor som helst som kan påverka svarsvariabeln. Även om det kan finnas många förklarande variabler , vi ska bekymrar oss i första hand om en enda förklarande variabel.
En svarsvariabel kanske inte finns i en studie. Namnet på denna typ av variabel beror på de frågor som ställs av en forskare. Genomförandet av en observationsstudie skulle vara ett exempel på ett fall där det inte finns en svarsvariabel. Ett experiment kommer att ha en svarsvariabel. Den noggranna designen av ett experiment försöker fastställa att förändringarna i en svarsvariabel är direkt orsakade av förändringar i de förklarande variablerna.
Exempel ett
För att utforska dessa begrepp kommer vi att undersöka några exempel. För det första exemplet, anta att en forskare är intresserad av att studera humöret och attityderna hos en grupp förstaårsstudenter. Alla förstaårsstudenter får en rad frågor. Dessa frågor är utformade för att bedöma graden av hemlängtan hos en student. Studenter anger också i undersökningen hur långt deras högskola är från hemmet.
En forskare som undersöker denna data kanske bara är intresserad av typen av studentsvar. Kanske är anledningen till detta att ha en övergripande känsla för sammansättningen av en ny förstaårsstudent. I det här fallet finns det ingen svarsvariabel. Detta beror på att ingen ser om värdet på en variabel påverkar värdet på en annan.
En annan forskare kunde använda samma data för att försöka svara på om elever som kom längre bort hade en högre grad av hemlängtan. I det här fallet är uppgifterna för hemlängtansfrågorna värdena på en svarsvariabel och de uppgifter som anger avståndet hemifrån utgör förklaringsvariabeln.
Exempel två
För det andra exemplet kan vi vara nyfikna på om antalet timmar som ägnas åt att göra läxor har en effekt på betyget en elev får på ett prov. I det här fallet, eftersom vi visar att värdet på en variabel ändrar värdet på en annan, finns det en förklarande och en svarsvariabel. Antalet studerade timmar är den förklarande variabeln och poängen på testet är svarsvariabeln.
Scatterplots och variabler
När vi arbetar med parade kvantitativa data är det lämpligt att använda ett spridningsdiagram. Syftet med den här typen av grafer är att visa samband och trender inom den parade datan. Vi behöver inte ha både en förklarande och svarsvariabel. Om så är fallet kan båda variablerna plottas längs båda axlarna. Men i händelse av att det finns ett svar och en förklaringsvariabel, så plottas den förklarande variabeln alltid längs x eller horisontell axel för ett kartesiskt koordinatsystem. Svarsvariabeln plottas sedan längs y
axel.
Oberoende och beroende
Distinktionen mellan förklarings- och svarsvariabler liknar en annan klassificering. Ibland hänvisar vi till variabler som oberoende eller beroende. Värdet av en beroende variabel är beroende av värdet för en oberoende variabel. En svarsvariabel motsvarar alltså en beroende variabel medan en förklarande variabel motsvarar en oberoende variabel. Denna terminologi används vanligtvis inte i statistik eftersom den förklarande variabeln inte är riktigt oberoende. Istället tar variabeln bara de värden som observeras. Vi kanske inte har någon kontroll över värdena på en förklarande variabel.