Compartilhamento de tecnologia

Modelo de regressão logística (não um problema de regressão, mas um problema de classificação binária)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Função de ativação sigmóide:

A função Sigmóide é uma função de ativação importante para a construção de um modelo de regressão logística, conforme mostrado na figura abaixo.
Insira a descrição da imagem aqui

  • doisO objetivo do problema de classificação é controlar a saída do modelo dentro do intervalo de [0,1], quando o resultado da saída do modelo é <0,5, o resultado da predição padrão é 0; quando o resultado da saída do modelo é >0,5, o resultado da predição padrão é 1;
  • A ideia para resolver o problema de classificação binária é mapear a entrada x do problema de classificação binária para a entrada z da função Sigmóide construindo um modelo de regressão logística f para calcular a saída ge, em seguida, obter o resultado do modelo de regressão logística com base no intervalo de g (se for maior que 0,5) (ou seja, o resultado de um problema de duas classificações).
  • O domínio da função ∈ R, o intervalo de valores ∈ [0,1], quandoDigite z<0Quando, função SogmóideResultado de saída g<0,5,O padrão éO resultado é 0,constituirA primeira categoria do problema de classificação binária .quandoInsira z>0Quando, função SogmóideResultado de saída g>0,5,O padrão éO resultado é 1,constituirA segunda categoria do problema de classificação binária

2. Introdução à regressão logística:

A regressão logística é usada para resolverProblema de duas classificações . Para problemas de classificação, há apenas um número limitado de resultados de saída do modelo (para problemas de regressão, existem infinitos).No problema de classificação binária, existem apenas dois resultados de saída do modelo.

No caso clássico do problema de regressão "Caso de previsão de tumor", o recurso de tamanho do tumor é usado para prever se o tumor é maligno. Existem apenas dois resultados de saída: sim (1) ou não (0).
Insira a descrição da imagem aqui
Neste momento, é difícil ajustar o conjunto de treinamento usando um modelo de regressão linear.(A regressão linear resolve um problema de regressão, enquanto o caso de previsão de tumor é um problema de classificação, ou um problema de classificação binária, para ser mais preciso), então foi proposta a ideia de regressão logística.
Insira a descrição da imagem aqui
Modelo de regressão logística (resolver problemas de classificação): insira um recurso ou conjunto de recursos X e produza um número entre 0 e 1 , onde a curva de ajuste é construída através da função Sogmóide. O processo de construção específico é o seguinte:
Insira a descrição da imagem aqui
Insira a descrição da imagem aqui

  • A primeira linha explica:Modelo de regressão logísticafConstrua regressão sinlinear porConjunto de recursos de entrada X e resultado de previsão de saída f, a diferença é queintervalo de valores f∈[0,1]
  • Explicação da segunda, terceira e quarta linhas: Anteriormente, introduzimos que a saída g da função Sigmóide pode resolver muito bem o problema de duas classificações, então usamos habilmente a função Sigmóide para construir o modelo de regressão logística f para resolver os dois- problema de classificação.Mapeie o conjunto de recursos de entrada X para a entrada z da função Sigmóide usando regressão linear ou regressão polinomialImplemente a saída da função SigmoidEm seguida, calcule a saída f (0 ou 1) do modelo de regressão logística com base no fato de o resultado da saída da função sigmóide ser maior que 0,5., obtenha o resultado do problema de duas classificações.
  • Explicação da quinta linha: As ideias acima podem ser integradas para obter o modelo de regressão logística f, no qual a entrada do modelo é o conjunto de características X e a saída é o resultado previsto da classificação 0 ou 1.
  • Explicação da sexta linha: Quando o resultado de saída do modelo de regressão logística é maior ou igual a 0,5, o valor previsto y^ é 1, o que significa que o tumor é um tumor maligno no exemplo acima quando o resultado de saída de; o modelo de regressão logística é menor ou igual a 0,5. O valor previsto é 0, o que significa que o tumor não é maligno, usando o exemplo acima.

3. Limites de decisão

Não é difícil deduzir do que foi dito acima que quando a entrada z da função Sigmóide é maior ou igual a 0, ou seja, quando o mapeamento z = wx + b do conjunto de recursos X a z é maior ou igual a 0, o resultado de saída do modelo é 1; quando a entrada z da função Sigmóide é menor que 0, ou seja, quando o mapeamento z=wx+b do conjunto de recursos X a z é menor que 0, o resultado de saída do modelo é 0.
Este é o conceito pelo qual podemos definir limites de decisão:A equação que torna o mapeamento da entrada do modelo X para a entrada da função Sigmóide z igual a 0 é chamada de limite de decisão.

Tomando o modelo de predição de tumor acima como exemplo, o mapeamento da entrada do modelo X para a entrada da função sigmóide z é z=wx+b, então o limite de decisão é wx+b=0.

Vamos usar uma imagem para ilustrar o significado do limite de decisão:

  • Exemplo 1:mapear para função linear
    Insira a descrição da imagem aqui
    A figura acima mostra o verdadeiro valor do rótulo quando os recursos x1 e x2 no conjunto de treinamento têm valores diferentes. O círculo representa o resultado da classificação da amostra como 0 e a cruz representa o resultado da classificação da amostra como 1.

    O modelo de regressão logística é mostrado acima, onde o mapeamento da entrada do modelo X para a entrada da função Sigmóide z é z=w1x1+w2x2+b, e o limite de decisão é w1x1+w2x2+b=0. Se os resultados do treinamento do modelo forem w1=1, w2=1, b=-3, o limite de decisão é x1+x2-3=0, e a imagem da função do limite de decisão é mostrada na figura acima,Pode-se observar que se as características da amostra estiverem localizadas no lado esquerdo do limite de decisão, a previsão da regressão logística é 0, caso contrário é 1. Este é o significado da imagem do limite de decisão.

  • Exemplo 2:Mapear para função polinomial
    Insira a descrição da imagem aqui
    O mapeamento da entrada do modeloA posição das características da amostra em relação ao limite de decisão determina o resultado da predição da amostra.

4. Processo de treinamento do modelo de regressão logística:

Na verdade, é igual ao processo de treinamento de regressão linear, exceto que o modelo (função) a ser treinado é diferente.

1. Objetivos do treinamento:

Insira a descrição da imagem aqui

2. Parâmetros de ajuste de gradiente descendente:

Insira a descrição da imagem aqui