Compartir tecnología

Modelo de regresión logística (no es un problema de regresión, sino un problema de clasificación binaria)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Función de activación sigmoidea:

La función sigmoidea es una función de activación importante para construir un modelo de regresión logística, como se muestra en la siguiente figura.
Insertar descripción de la imagen aquí

  • dosEl objetivo del problema de clasificación es controlar la salida del modelo dentro del rango de [0,1], cuando el resultado de salida del modelo es <0,5, el resultado de predicción predeterminado es 0; cuando el resultado de salida del modelo es>0,5, el resultado de predicción predeterminado es 1;
  • La idea de resolver el problema de clasificación binaria es mapear la entrada x del problema de clasificación binaria a la entrada z de la función sigmoidea mediante la construcción de un modelo de regresión logística f para calcular la salida g, y luego obtener el resultado del modelo de regresión logística. basado en el rango de g (si es mayor que 0,5) (es decir, el resultado de un problema de dos clasificaciones).
  • El dominio de la función ∈ R, el rango de valores ∈ [0,1], cuandoIngrese z<0Cuándo, función sogmoideaResultado de salida g<0,5,El valor predeterminado esEl resultado es 0,constituirLa primera categoría del problema de clasificación binaria. .cuandoIntroduzca z>0Cuándo, función sogmoideaResultado de salida g>0,5,El valor predeterminado esEl resultado es 1,constituirLa segunda categoría del problema de clasificación binaria.

2. Introducción a la regresión logística:

La regresión logística se utiliza para resolverProblema de dos clasificaciones . Para los problemas de clasificación, sólo hay un número limitado de resultados de salida del modelo (para los problemas de regresión, hay infinitos).En el problema de clasificación binaria, solo hay dos resultados de salida del modelo.

En el caso clásico del problema de regresión "Caso de predicción de tumores", la función de tamaño del tumor se utiliza para predecir si el tumor es maligno. Solo hay dos resultados de salida: sí (1) o no (0).
Insertar descripción de la imagen aquí
En este momento, es difícil ajustar el conjunto de entrenamiento utilizando un modelo de regresión lineal.(La regresión lineal resuelve un problema de regresión, mientras que el caso de predicción de tumores es un problema de clasificación o, para ser precisos, un problema de clasificación binaria), por lo que se propuso la idea de regresión logística.
Insertar descripción de la imagen aquí
Modelo de regresión logística (resolver problemas de clasificación): ingrese una característica o conjunto de características X y genere un número entre 0 y 1 , donde la curva de ajuste se construye mediante la función sogmoidea. El proceso constructivo específico es el siguiente:
Insertar descripción de la imagen aquí
Insertar descripción de la imagen aquí

  • La primera línea explica:Modelo de regresión logísticaConstruya una regresión sinlineal medianteConjunto de características de entrada X y resultado de predicción de salida f, la diferencia es querango de valores f∈[0,1]
  • Explicación de las líneas segunda, tercera y cuarta: Anteriormente presentamos que la salida g de la función sigmoidea puede resolver muy bien el problema de dos clasificaciones, por lo que utilizamos inteligentemente la función sigmoidea para construir el modelo de regresión logística f para resolver las dos problema de clasificación.Asigne el conjunto de características de entrada X a la entrada z de la función sigmoidea mediante regresión lineal o regresión polinómicaImplementar la salida de la función sigmoidea.Luego calcule la salida f (0 o 1) del modelo de regresión logística en función de si el resultado de salida de la función sigmoidea es mayor que 0,5., obtenga el resultado del problema de dos clasificaciones.
  • Explicación de la quinta línea: Las ideas anteriores se pueden integrar para obtener el modelo de regresión logística f, en el que la entrada del modelo es el conjunto de características X y la salida es el resultado predicho de la clasificación 0 o 1.
  • Explicación de la sexta línea: cuando el resultado de salida del modelo de regresión logística es mayor o igual a 0,5, el valor predicho y^ es 1, lo que significa que el tumor es un tumor maligno en el ejemplo anterior; el modelo de regresión logística es menor o igual a 0,5. El valor previsto es 0, lo que significa que el tumor no es maligno, usando el ejemplo anterior.

3. Límites de decisión

De lo anterior no es difícil deducir que cuando la entrada z de la función sigmoidea es mayor o igual a 0, es decir, cuando el mapeo z = wx + b del conjunto de características X a z es mayor o igual a 0, el resultado de salida del modelo es 1; cuando la entrada z de la función sigmoidea es menor que 0, es decir, cuando la asignación z = wx + b del conjunto de características X a z es menor que 0, el resultado de salida. del modelo es 0.
Este es el concepto mediante el cual podemos llegar a límites de decisión:La ecuación que hace que la asignación de la entrada X del modelo a la entrada z de la función sigmoidea sea igual a 0 se llama límite de decisión.

Tomando el modelo de predicción de tumores anterior como ejemplo, el mapeo de la entrada del modelo X a la entrada de la función sigmoidea z es z = wx + b, entonces el límite de decisión es wx + b = 0.

Usemos una imagen para ilustrar el significado del límite de decisión:

  • Ejemplo 1:mapa a función lineal
    Insertar descripción de la imagen aquí
    La figura anterior muestra el valor real de la etiqueta cuando las características x1 y x2 en el conjunto de entrenamiento tienen valores diferentes. El círculo representa el resultado de clasificación de la muestra como 0 y la cruz representa el resultado de clasificación de la muestra como 1.

    El modelo de regresión logística es como se muestra arriba, donde el mapeo de la entrada del modelo X a la entrada de la función sigmoidea z es z = w1x1 + w2x2 + b, y el límite de decisión es w1x1 + w2x2 + b = 0. Si los resultados del entrenamiento del modelo son w1 = 1, w2 = 1, b = -3, el límite de decisión es x1 + x2-3 = 0 y la imagen de la función del límite de decisión se muestra en la figura anterior.Se puede ver que si las características de la muestra están ubicadas en el lado izquierdo del límite de decisión, la predicción de la regresión logística es 0; de lo contrario, es 1. Este es el significado de la imagen del límite de decisión.

  • Ejemplo 2:Mapa a función polinómica
    Insertar descripción de la imagen aquí
    El mapeo de la entrada del modelo.La posición de las características de la muestra en relación con el límite de decisión determina el resultado de la predicción de la muestra.

4. Proceso de formación del modelo de regresión logística:

De hecho, es lo mismo que el proceso de entrenamiento de regresión lineal, excepto que el modelo (función) a entrenar es diferente.

1. Objetivos de la formación:

Insertar descripción de la imagen aquí

2. Parámetros de ajuste del descenso de gradiente:

Insertar descripción de la imagen aquí