Las ventajas y desventajas de un modelo de regresión múltiple

La regresión múltiple se utiliza para examinar la relación entre varias variables independientes y una variable dependiente. Si bien los modelos de regresión múltiple le permiten analizar las influencias relativas de estas variables independientes o predictoras en la variable dependiente o de criterio, estos conjuntos de datos a menudo complejos pueden llevar a conclusiones falsas si no se analizan adecuadamente.

Ejemplos de regresión múltiple

Un agente de bienes raíces podría utilizar la regresión múltiple para analizar el valor de las casas. Por ejemplo, podría usar como variables independientes el tamaño de las casas, sus edades, el número de dormitorios, el precio promedio de la vivienda en el vecindario y la proximidad a las escuelas. Al trazarlos en un modelo de regresión múltiple, podría usar estos factores para ver su relación con los precios de las viviendas como variable de criterio.

Otro ejemplo de uso de un modelo de regresión múltiple podría ser alguien en recursos humanos que determina el salario de los puestos gerenciales, la variable de criterio. Las variables predictoras podrían ser la antigüedad de cada gerente, la cantidad promedio de horas trabajadas, la cantidad de personas a cargo y el presupuesto departamental del gerente.

instagram story viewer

Ventajas de la regresión múltiple

Existen dos ventajas principales al analizar datos mediante un modelo de regresión múltiple. La primera es la capacidad de determinar la influencia relativa de una o más variables predictoras en el valor del criterio. El agente de bienes raíces podría encontrar que el tamaño de las casas y el número de dormitorios tienen una fuerte correlación con el precio de un hogar, mientras que la proximidad a las escuelas no tiene correlación en absoluto, o incluso una correlación negativa si se trata principalmente de una jubilación comunidad.

La segunda ventaja es la capacidad de identificar valores atípicos o anomalías. Por ejemplo, al revisar los datos relacionados con los salarios de la gerencia, el gerente de recursos humanos podría encontrar que el número de horas trabajadas, el tamaño del departamento y su presupuesto tenían una fuerte correlación con los salarios, mientras que la antigüedad sí no. Alternativamente, podría ser que todos los valores de predictores enumerados estuvieran correlacionados con cada uno de los salarios que se estaban examinando, excepto por un gerente que estaba siendo pagado en exceso en comparación con los demás.

Desventajas de la regresión múltiple

Cualquier desventaja de usar un modelo de regresión múltiple generalmente se reduce a los datos que se usan. Dos ejemplos de esto son el uso de datos incompletos y la conclusión falsa de que una correlación es una causalidad.

Al revisar el precio de las casas, por ejemplo, suponga que el agente de bienes raíces miró solo 10 casas, siete de las cuales fueron compradas por padres jóvenes. En este caso, la relación entre la proximidad de las escuelas puede llevarla a creer que esto tuvo un efecto en el precio de venta de todas las viviendas que se vendían en la comunidad. Esto ilustra las trampas de los datos incompletos. Si hubiera utilizado una muestra más grande, podría haber encontrado que, de cada 100 casas vendidas, solo el diez por ciento de los valores de las casas estaban relacionados con la proximidad de una escuela. Si hubiera utilizado las edades de los compradores como valor predictivo, podría haber descubierto que los compradores más jóvenes estaban dispuestos a pagar más por las viviendas de la comunidad que los compradores mayores.

En el ejemplo de los salarios de la gerencia, suponga que hay un caso atípico que tiene un presupuesto más pequeño, menos antigüedad y menos personal para administrar, pero que gana más que cualquier otra persona. El gerente de recursos humanos podría mirar los datos y concluir que a esta persona se le está pagando en exceso. Sin embargo, esta conclusión sería errónea si no tuviera en cuenta que este gerente estaba a cargo del sitio web de la empresa y tenía un conjunto de habilidades muy codiciado en seguridad de redes.

Teachs.ru
  • Cuota
instagram viewer