Definición de Regresión Logística

Marcoantonio Villanueva Bustamante
Doctor en Psicología

La regresión logística es parte de los modelos de regresión y se emplea cuando la variable que se desea predecir es categórica; sin importar si la variable independiente es categórica o cuantitativa.

En las ciencias sociales, como en cualquier ciencia, se pretende buscar explicaciones a los fenómenos de interés. Sin embargo, a diferencia de las ciencias duras que emplea modelos algebraicos para llegar a conclusiones en las ciencias sociales se recurre al análisis de datos, que se fundamenta en la estadística y la probabilidad, para llegar a sus conclusiones debido a la naturaleza multifactorial y poco estable de los fenómenos que estudia. Dentro del análisis de datos, la técnica que permite dar explicaciones certeras a los fenómenos estudiados es la técnica multivariada llamada Análisis de Regresión.

Al hablar del análisis de regresión en realidad nos referimos a una familia de técnicas de análisis, de las que podemos mencionar el análisis de regresión lineal simple y múltiple (siendo esta las más usadas), análisis de mediación y moderación e incluso se podría considerar a los modelos de ecuaciones estructurales (SEM), que son una técnica de regresión múltiples más sofisticada. Sin embargo, las técnicas previamente descritas tienen una característica en común, se emplean cuando la variable que se intenta predecir es cuantitativa (o continua) es decir, tienen un nivel de medición intervalar o de razón. Entonces, ¿qué pasa cuando nuestra variable no alcanza estos niveles de medición? Es decir, se cuenta con variables nominales u ordinales. En estos casos, se debe recurrir a técnicas alternativas como el Análisis de Regresión Logística.

Antes de profundizar en la regresión logística, es necesario realizar un par de aclaraciones. En primer lugar, la regresión logística opera del mismo modo que una regresión lineal, es de decir, requiere de una o más variables de entrada que pueden adquirir el nombre de predictoras, variables independientes, variables explicativas o variables antecedentes, las cuales serán de naturaleza categórica o cuantitativa y que pretenden predecir la mayor cantidad posible de varianza de la variable de salida. El otro elemento que requiere el análisis de regresión es la variable dependiente o también conocida como criterio y la cual es de naturaleza categórica (nominal u ordinal). Si se tiene dos o más variables independientes, el análisis de regresión también intenta determinar cuál de estas tiene mayor influencia sobre la variable dependiente.

El segundo punto a considerar, es el tipo de regresión logística que se puede aplicar. Es decir, cuando se tienen variables categóricas estas pueden ser dicotómicas, es decir, que cuentan con dos categorías (por ejemplo, sexo asignado al nacer (hombre-mujer) o tipo de universidad (pública-privada) etc.); o bien, variables politómicas que tienen más de dos categorías (por ejemplo, género (masculino-femenino-no binario), religión (católica-cristiana-judía), etc.). De este modo, si se tiene una variable dicotómica se deberá emplear una regresión logística binaria; por el contrario, si se tiene una variable politómica se deberá emplear una regresión logística nominal, politómica o multinomial. Tanto en la regresión binaria como multinomial se intenta determinar las probabilidades (o pronostico) de las variables independientes sobre las dependientes a fin de realizar clasificaciones de la muestra.

Regresión logística binaria

Al emplear una regresión binaria se trabaja con variables dicotómicas por lo que se le deben asignarse se deben asignar valores a nuestras variables (por ejemplo, 1= respuesta correcta 2= respuesta incorrecta; 0 = tratamiento eficaz 1= tratamiento ineficaz), si bien el valor asignado es irrelevante siempre y cuando el analista sepa que significa cada uno, lo típico es emplear 0 y 1. De este modo, se puede emplear la siguiente expresión matemática

\(P\left(Y=1\right)=(1-P(Y=0)\)

Al realizar la regresión binaria se podrá conocer que ocurre en una categoría pero también podremos saber que sucede en la otra. Por ejemplo, si nos enfocamos en la categoría 1, la media que se obtendrá es la proporción de “1´s” con la que se cuenta. Dicho de otra manera, a diferencia de una regresión lineal que intenta pronosticar el valor de una variable, en la regresión binaria se intenta pronosticar la probabilidad de pertenecer a una de estas dos categorías y que se expresa de la siguiente manera.

\(E\left(Y\right)=P\left(Y=1\right)=\ \pi_1\)

La formula de la regresión binaria se expresa de la siguiente manera:

\(\pi_1=\ B_0+\ B_1\ X\)

Donde:

\(\pi_1\) = se refiere al pronóstico lineal de las variables X y Y

\(B_0\) = Punto en el que la recta corta el eje vertical, también llamado constante

\(B_1\) = Es la pendiente de la recta, es decir, su grado de inclinación

Regresión logística nominal, politómica o multinomial

Como ya se ha mencionado previamente, cuando la variable categórica tiene más de dos valores no es posible emplear la regresión binaria; en estos casos se tiene que recurrir a otras alternativas, es decir, regresión nominal, politómica o multinomial, pero ¿por qué son de tres tipos?

Nominal: enfatiza el nivel de medición de la variable dependiente

Politómica: subraya que la variable categórica tiene más de dos grupos o categorías

Multinomial: destaca que en cada patrón de variabilidad las frecuencias de las categorías de la variable según un modelo de probabilidad multinomial.

La fórmula de esta regresión es la siguiente:

\({log}_e\frac{\pi_k}{\pi_K}=\ \beta_{0k}+\ \beta_{1k}X_1+\ \beta_{2k}X_2\ldots+\ \beta_{nk}X_n\)

La única diferencia con la fórmula anterior es la inclusión del enlace logit, el cual se define como un modelo de elección binaria que se basa en una distribución logística.

 
 
 
Por: Marcoantonio Villanueva Bustamante. Licenciado en Psicología, egresado de la Facultad de Psicología de la UNAM, México. Doctor en Psicología por la UFRO, Chile. Actualmente, es investigador independiente que forma parte de diversos equipos de investigación en México y Chile.

Trabajo publicado en: Jun., 2024.
Datos para citar en modelo APA: Villanueva Bustamante, M. (junio, 2024). Definición de Regresión Logística. Significado.com. Desde https://significado.com/regresion-logistica/
 

Escriba un comentario

Contribuya con su comentario para sumar valor, corregir o debatir el tema.


Privacidad: a) sus datos no se compartirán con nadie; b) su email no será publicado; c) para evitar malos usos, todos los mensajes son moderados.
 
Índice
  • A
  • B
  • C
  • D
  • E
  • F
  • G
  • H
  • I
  • J
  • K
  • L
  • M
  • N
  • O
  • P
  • Q
  • R
  • S
  • T
  • U
  • V
  • W
  • X
  • Y
  • Z