Qué simple modelo de regresión lineal y cómo funciona

Qué simple modelo de regresión lineal y cómo funciona

Los modelos de regresión lineal se utilizan para mostrar o predecir la relación entre dos variables o factores. El factor que se está predicho (el factor de que la ecuación resueltos para) se llama elvariable dependiente. Los factores que se utilizan para predecir el valor de la variable dependiente se denominan variables independientes.

En la regresión lineal, cada observación consta de dos valores. Un valor es para la variable dependiente y un valor es para la variable independiente. En este modelo simple, una línea recta se aproxima a la relación entre la variable dependiente y la variable independiente.

Cuando se usan dos o más variables independientes en el análisis de regresión, el modelo ya no es simple lineal. Esto se conoce como regresión múltiple.

Fórmula para un modelo de regresión lineal simple

Se designan los dos factores que están involucrados en el análisis de regresión lineal simple X y Y. La ecuación que describe cómo Y está relacionado con X se conoce como el Modelo de regresión.

El modelo de regresión lineal simple está representado por:

Y = β0 +β1X

El modelo de regresión lineal contiene un término de error representado por ε. El término de error se usa para tener en cuenta la variabilidad en Y que no puede explicarse por la relación lineal entre X y Y. Si ε no estuviera presente, eso significaría que saber X proporcionaría suficiente información para determinar el valor de Y.

También hay parámetros que representan la población que se está estudiando. Estos parámetros del modelo están representados por β0 y β1.

La ecuación de regresión lineal simple se graba como una línea recta, donde:

  1. β0 es la intersección y de la línea de regresión.
  2. β1 es la pendiente.
  3. Ε(Y) es el valor medio o esperado de Y para un valor dado de X.

Una línea de regresión puede mostrar una relación lineal positiva, una relación lineal negativa o ninguna relación.

  1. Sin relación: La línea gráfica en una regresión lineal simple es plana (no inclinada). No hay relación entre las dos variables.
  2. Relación positiva: La línea de regresión se inclina hacia arriba con el extremo inferior de la línea en la intersección y (eje) del gráfico y el extremo superior de la línea se extiende hacia arriba hacia el campo de gráfico, lejos de la intersección X (eje). Existe una relación lineal positiva entre las dos variables: a medida que aumenta el valor de uno, el valor del otro también aumenta.
  3. Relación negativa: La línea de regresión se inclina hacia abajo con el extremo superior de la línea en la intersección y (eje) del gráfico y el extremo inferior de la línea se extiende hacia abajo hacia el campo de gráfico, hacia la intersección X (eje). Existe una relación lineal negativa entre las dos variables: a medida que aumenta el valor de uno, el valor de la otra disminuye.

La ecuación de regresión lineal estimada

Si se conocieran los parámetros de la población, la ecuación de regresión lineal simple (que se muestra a continuación) podría usarse para calcular el valor medio de Y por un valor conocido de X.

Ε(Y) = β0 +β1X

En la práctica, sin embargo, los valores de los parámetros generalmente no se conocen, por lo que deben estimarse utilizando datos de una muestra de la población. Los parámetros de la población se estiman utilizando estadísticas de muestra. Las estadísticas de muestra están representadas por β0 y β1. Cuando las estadísticas de muestra se sustituyen por los parámetros de la población, se forma la ecuación de regresión estimada.

La ecuación de regresión estimada es:

(ŷ) = β0 +β1X

Nota: (ŷ) se pronuncia Y.

El gráfico de la ecuación de regresión simple estimada se denomina línea de regresión estimada.

  1. β0 es la intersección y de la línea de regresión.
  2. β1 es la pendiente.
  3. (ŷ) es el valor estimado de Y para un valor dado de X.

Límites de regresión lineal simple

Incluso los mejores datos no cuentan una historia completa. 

El análisis de regresión se usa comúnmente en la investigación para establecer que existe una correlación entre las variables. Pero la correlación no es lo mismo que la causalidad: una relación entre dos variables no significa que uno haga que el otro suceda. Incluso una línea en una regresión lineal simple que se ajuste bien a los puntos de datos puede no garantizar una relación de causa y efecto.

El uso de un modelo de regresión lineal le permitirá descubrir si existe una relación entre variables. Para comprender exactamente cuál es esa relación y si una variable causa otra, necesitará investigación adicional y análisis estadístico.