Bias är felet i uppskattningar som beror på systematiska misstag som leder till konsekvent höga eller låga resultat jämfört med de faktiska värdena. Den individuella biasen för en uppskattning som är känd för att vara partisk är skillnaden mellan de uppskattade och faktiska värdena. Om uppskattningen inte är känd för att vara partisk kan skillnaden också bero på slumpmässiga fel eller andra felaktigheter. I motsats till bias, som alltid verkar i en riktning, kan dessa fel vara positiva eller negativa.
För att beräkna biasen för en metod som används för många uppskattningar, hitta felen genom att subtrahera varje uppskattning från det faktiska eller observerade värdet. Lägg ihop alla fel och dividera med antalet uppskattningar för att få biasen. Om felen summerar till noll, var uppskattningarna opartiska och metoden ger opartiska resultat. Om uppskattningarna är partiska kan det vara möjligt att hitta källan till biasen och eliminera den för att förbättra metoden.
TL;DR (Too Long; Didn’t Read)
Beräkna bias genom att hitta skillnaden mellan en uppskattning och det faktiska värdet. För att hitta biasen för en metod, utför många uppskattningar och summera felen i varje uppskattning jämfört med det verkliga värdet. Att dividera med antalet uppskattningar ger metodens bias. I statistik kan det finnas många uppskattningar för att hitta ett enda värde. Bias är skillnaden mellan medelvärdet av dessa uppskattningar och det faktiska värdet.
Hur bias fungerar
När uppskattningar är partiska är de konsekvent fel i en riktning på grund av misstag i systemet som används för uppskattningarna. Till exempel kan en väderprognos konsekvent förutsäga temperaturer som är högre än de som faktiskt observerats. Prognosen är partisk, och någonstans i systemet finns ett misstag som ger för hög uppskattning. Om prognosmetoden är opartisk kan den fortfarande förutsäga temperaturer som inte är korrekta, men de felaktiga temperaturerna kommer ibland att vara högre och ibland lägre än de observerade temperaturerna.
Statistisk bias fungerar på samma sätt men baseras vanligtvis på ett stort antal uppskattningar, undersökningar eller prognoser. Dessa resultat kan representeras grafiskt i en fördelningskurva och bias är skillnaden mellan medelvärdet av fördelningen och det faktiska värdet. Om det finns bias kommer det alltid att finnas en skillnad även om vissa individuella uppskattningar kan falla på vardera sidan av det faktiska värdet.
Bas in Surveys
Ett exempel på bias är en undersökning företag som gör omröstningar under valkampanjer, men deras valresultat överskattar konsekvent resultaten för ett politiskt parti jämfört med det faktiska valresultatet. Biasen kan beräknas för varje val genom att subtrahera det faktiska resultatet från omröstningsförutsägelsen. Den genomsnittliga biasen för den använda pollingmetoden kan beräknas genom att hitta medelvärdet av de individuella felen. Om partiskheten är stor och konsekvent kan röstningsföretaget försöka ta reda på varför deras metod är partisk.
Bias kan komma från två huvudsakliga källor. Antingen är urvalet av deltagare för omröstningen partiskt, eller så är partiskheten ett resultat av tolkningen av informationen från deltagarna. Till exempel är internetundersökningar i sig partiska eftersom deltagarna i undersökningen som fyller i internetformulären inte är representativa för hela befolkningen. Detta är en urvalsbias.
Omröstningsföretag är medvetna om denna urvalsbias och kompensera genom att justera siffrorna. Om resultaten fortfarande är partiska är det en informationsbias eftersom företagen inte tolkat informationen korrekt. I alla dessa fall visar en bias-beräkning i vilken utsträckning de uppskattade värdena är användbara och när metoderna behöver justeras.