Bias on virhe arvioissa, jotka johtuvat järjestelmällisistä virheistä, jotka johtavat jatkuvasti korkeisiin tai mataliin tuloksiin verrattuna todellisiin arvoihin. Estimaatin, jonka tiedetään olevan puolueellinen, yksittäinen poikkeama on ero arvioitujen ja todellisten arvojen välillä. Jos estimaatin ei tiedetä olevan puolueellinen, ero voi johtua myös satunnaisvirheestä tai muista epätarkkuuksista. Nämä virheet voivat olla positiivisia tai negatiivisia, toisin kuin puolueellisuus, joka toimii aina yhteen suuntaan.
Jos haluat laskea monissa arvioissa käytetyn menetelmän harhaa, etsi virheet vähentämällä kukin arvio todellisesta tai havaitusta arvosta. Laske kaikki virheet ja jaa arvioiden lukumäärällä saadaksesi ennakkoluulot. Jos virheiden summa on nolla, arviot olivat puolueettomia ja menetelmä tuottaa puolueettomia tuloksia. Jos arviot ovat puolueellisia, voi olla mahdollista löytää puolueiden lähde ja eliminoida se menetelmän parantamiseksi.
TL; DR (liian pitkä; Ei lukenut)
Laske ennakkoarvot löytämällä arvio ja todellinen arvo. Löydät menetelmän ennakkoarvon suorittamalla useita arvioita ja laskemalla yhteen kunkin estimaatin virheet todelliseen arvoon verrattuna. Jakamalla arvioiden lukumäärällä saadaan menetelmän puolueellisuus. Tilastoissa voi olla monia arvioita yhden arvon löytämiseksi. Bias on näiden arvioiden keskiarvon ja todellisen arvon välinen ero.
Kuinka ennakkoluulot toimivat
Kun arviot ovat puolueellisia, ne ovat jatkuvasti väärässä yhteen suuntaan johtuen arvioissa käytetyn järjestelmän virheistä. Esimerkiksi sääennuste voi jatkuvasti ennustaa lämpötiloja, jotka ovat korkeammat kuin tosiasiallisesti havaitut. Ennuste on puolueellinen, ja jossain järjestelmässä on virhe, joka antaa liian korkean arvion. Jos ennustemenetelmä on puolueeton, se voi silti ennustaa virheellisiä lämpötiloja, mutta väärät lämpötilat ovat joskus korkeammat ja toisinaan matalammat kuin havaitut lämpötilat.
Tilastollinen puolueellisuus toimii samalla tavalla, mutta perustuu yleensä suureen määrään arvioita, tutkimuksia tai ennusteita. Nämä tulokset voidaan esittää graafisesti jakelukäyrässä, ja puolueellisuus on jakauman keskiarvon ja todellisen arvon ero. Jos on puolueellisuutta, ero on aina olemassa, vaikka jotkut yksittäiset arviot saattavatkin pudota todellisen arvon kummallekin puolelle.
Bias kyselyissä
Esimerkki puolueellisuudesta on tutkimusyritys, joka suorittaa kyselyjä vaalikampanjoiden aikana, mutta heidän äänestyksensä tulokset yliarvioivat yhden poliittisen puolueen tulokset johdonmukaisesti varsinaisiin vaaleihin verrattuna tuloksia. Bias voidaan laskea jokaiselle vaaleille vähentämällä todellinen tulos kyselyn ennusteesta. Käytetyn kyselymenetelmän keskimääräinen harhaisuus voidaan laskea etsimällä yksittäisten virheiden keskiarvo. Jos ennakkoluulot ovat suuria ja johdonmukaisia, äänestysyritys voi yrittää selvittää, miksi heidän menetelmänsä on puolueellinen.
Bias voi tulla kahdesta päälähteestä. Joko osallistujien valinta kyselyyn on puolueellinen, tai puolueellisuus johtuu osallistujilta saatujen tietojen tulkinnasta. Esimerkiksi Internet-kyselyt ovat luonnostaan puolueellisia, koska kyselyyn osallistuneet, jotka täyttävät Internet-lomakkeet, eivät edusta koko väestöä. Tämä on valinnan puolueellisuus.
Äänestysyritykset ovat tietoisia tästä valintapoikkeamasta ja kompensoivat niitä säätämällä numeroita. Jos tulokset ovat edelleen puolueellisia, se on tiedon puolueellisuutta, koska yritykset eivät tulkitse tietoja oikein. Kaikissa näissä tapauksissa esijännityslaskenta osoittaa, missä määrin arvioidut arvot ovat hyödyllisiä ja milloin menetelmiä on muutettava.