Ett spridningsdiagram är ett viktigt diagnostiskt verktyg i en statistikers arsenal, erhållet genom att plotta två variabler mot varandra. Det tillåter statistikern att öga variablerna och bilda en arbetshypotes om deras förhållande. Av denna anledning ritas den vanligtvis innan en regressionsanalys utförs. Statistikern testar därefter hypotesen med hjälp av en regressionsanalys och bestämmer tecknet och den exakta storleken på sambandet. Dessutom hjälper ett spridningsdiagram att identifiera extremvärden – värden som är onormalt långt från de flesta data i provet. Att eliminera extremvärden hjälper till att förbättra regressionsmodellen.
Kontrollera om det finns ett negativt samband mellan de två variablerna i spridningsdiagrammet. Om låga värden på den första variabeln överensstämmer med höga värden på den andra variabeln finns det en negativ korrelation. I det här fallet har en linje som dras genom datapunkterna en negativ lutning.
Undersök spridningsdiagrammet för positivt samband mellan variabler. Om låga värden för den första variabeln i spridningsdiagrammet överensstämmer med låga värden för den andra, och de höga värdena för den första på liknande sätt motsvarar de höga värdena för den andra, har variablerna en positiv korrelation. I det här fallet har en linje som dras genom datapunkterna en positiv lutning.
Inspektera spridningsdiagrammet för att se om det inte finns något samband mellan variablerna. Om datapunkterna i spridningsdiagrammet är slumpmässigt fördelade utan något uppenbart samband mellan de två, har de antingen ingen korrelation eller liten, statistiskt obetydlig korrelation. I detta fall är en linje som dras genom datapunkterna horisontell med lutning lika med noll.
Passa en linje genom datapunkterna och undersök dess form för att mäta karaktären av sambandet mellan de två variablerna. En rät linje tolkas som ett linjärt samband, en krökt form antyder ett kvadratiskt samband och en linje som ligger relativt platt innan den plötsligt skjuter upp eller ner tolkas som ett exponentiellt samband.
Undersök spridningsdiagrammet för extremvärden, värden som ligger onormalt långt från klustret av datapunkter. Outliers förvränger förhållandet mellan variablerna. Eliminera dem, men bara om deras frånvaro inte påverkar analysen av sambandet mellan de två variablerna.