El sesgo es el error en las estimaciones debido a errores sistemáticos que conducen a resultados consistentemente altos o bajos en comparación con los valores reales. El sesgo individual de una estimación que se sabe que está sesgada es la diferencia entre los valores estimados y reales. Si no se sabe que la estimación esté sesgada, la diferencia también podría deberse a un error aleatorio u otras inexactitudes. Al contrario del sesgo, que siempre actúa en una dirección, estos errores pueden ser positivos o negativos.
Para calcular el sesgo de un método utilizado para muchas estimaciones, encuentre los errores restando cada estimación del valor real u observado. Sume todos los errores y divida por el número de estimaciones para obtener el sesgo. Si los errores suman cero, las estimaciones fueron insesgadas y el método arroja resultados insesgados. Si las estimaciones están sesgadas, es posible encontrar la fuente del sesgo y eliminarlo para mejorar el método.
TL; DR (demasiado largo; No leí)
Calcule el sesgo encontrando la diferencia entre una estimación y el valor real. Para encontrar el sesgo de un método, realice muchas estimaciones y sume los errores en cada estimación en comparación con el valor real. Dividir por el número de estimaciones da el sesgo del método. En estadística, puede haber muchas estimaciones para encontrar un solo valor. El sesgo es la diferencia entre la media de estas estimaciones y el valor real.
Cómo funciona el sesgo
Cuando las estimaciones están sesgadas, son consistentemente erróneas en una dirección debido a errores en el sistema utilizado para las estimaciones. Por ejemplo, un pronóstico del tiempo puede predecir constantemente temperaturas más altas que las que se observan realmente. El pronóstico está sesgado y en algún lugar del sistema hay un error que da una estimación demasiado alta. Si el método de pronóstico es imparcial, aún puede predecir temperaturas que no son correctas, pero las temperaturas incorrectas serán a veces más altas y otras más bajas que las temperaturas observadas.
El sesgo estadístico funciona de la misma manera, pero generalmente se basa en una gran cantidad de estimaciones, encuestas o pronósticos. Estos resultados se pueden representar gráficamente en una curva de distribución y el sesgo es la diferencia entre la media de la distribución y el valor real. Si hay sesgo, siempre habrá una diferencia, aunque algunas estimaciones individuales pueden caer a ambos lados del valor real.
Sesgo en las encuestas
Un ejemplo de sesgo es una empresa de encuestas que realiza encuestas durante las campañas electorales, pero sus encuestas Los resultados sobreestiman constantemente los resultados de un partido político en comparación con las elecciones reales. resultados. El sesgo se puede calcular para cada elección restando el resultado real de la predicción de la encuesta. El sesgo promedio del método de sondeo utilizado se puede calcular encontrando el promedio de los errores individuales. Si el sesgo es grande y constante, la empresa encuestadora puede intentar averiguar por qué su método está sesgado.
El sesgo puede provenir de dos fuentes principales. O la selección de participantes para la encuesta está sesgada, o el sesgo resulta de la interpretación de la información recibida de los participantes. Por ejemplo, las encuestas de Internet están intrínsecamente sesgadas porque los participantes de la encuesta que completan los formularios de Internet no son representativos de toda la población. Este es un sesgo de selección.
Las empresas encuestadoras son conscientes de este sesgo de selección y lo compensan ajustando los números. Si los resultados aún están sesgados, es un sesgo de información porque las empresas no interpretaron la información correctamente. En todos estos casos, un cálculo de sesgo muestra hasta qué punto los valores estimados son útiles y cuándo es necesario ajustar los métodos.