Condivisione della tecnologia

Modello di regressione logistica (non un problema di regressione, ma un problema di classificazione binaria)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Funzione di attivazione del sigmoide:

La funzione Sigmoide è un'importante funzione di attivazione per costruire un modello di regressione logistica, come mostrato nella figura seguente.
Inserisci qui la descrizione dell'immagine

  • dueL'obiettivo del problema di classificazione è controllare l'output del modello entro l'intervallo di [0,1], quando il risultato dell'output del modello è <0,5, il risultato della previsione predefinita è 0; quando il risultato dell'output del modello è >0,5, il risultato della previsione predefinita è 1.
  • L'idea per risolvere il problema di classificazione binaria è mappare l'input x del problema di classificazione binaria sull'input z della funzione sigmoide costruendo un modello di regressione logistica f per calcolare l'output g, quindi ottenere il risultato del modello di regressione logistica in base all'intervallo di g (se è maggiore di 0,5) (ovvero il risultato di un problema a due classificazioni).
  • Il dominio della funzione ∈ R, l'intervallo di valori ∈ [0,1], quandoImmettere z<0Quando, funzione sogmoideaRisultato dell'output g<0,5,L'impostazione predefinita èIl risultato è 0,costituireLa prima categoria del problema di classificazione binaria .QuandoImmettere z>0Quando, funzione sogmoideaRisultato dell'uscita g>0,5,L'impostazione predefinita èIl risultato è 1,costituireLa seconda categoria del problema di classificazione binaria

2. Introduzione alla regressione logistica:

Per risolvere viene utilizzata la regressione logisticaDue problemi di classificazione . Per i problemi di classificazione, esiste solo un numero limitato di risultati in output dal modello (per i problemi di regressione, ce ne sono infiniti).Nel problema della classificazione binaria, ci sono solo due risultati di output del modello.

Nel classico caso di problema di regressione "Caso di previsione del tumore", la caratteristica della dimensione del tumore viene utilizzata per prevedere se il tumore è un tumore maligno. Sono disponibili solo due risultati di output: sì (1) o no (0).
Inserisci qui la descrizione dell'immagine
Al momento è difficile adattare il set di addestramento utilizzando un modello di regressione lineare.(La regressione lineare risolve un problema di regressione, mentre il caso di previsione del tumore è un problema di classificazione, o un problema di classificazione binaria per essere precisi), quindi è stata proposta l'idea della regressione logistica.
Inserisci qui la descrizione dell'immagine
Modello di regressione logistica (risolvere problemi di classificazione): inserisci una caratteristica o un set di caratteristiche X e genera in output un numero compreso tra 0 e 1 , dove la curva di adattamento è costruita tramite la funzione Sogmoide. Il processo di costruzione specifico è il seguente:
Inserisci qui la descrizione dell'immagine
Inserisci qui la descrizione dell'immagine

  • La prima riga spiega:Modello di regressione logisticafCostruisci la regressione sinlineare tramiteSet di funzionalità di input X e risultato della previsione di output f, la differenza è questaintervallo valori f∈[0,1]
  • Spiegazione della seconda, terza e quarta riga: in precedenza abbiamo introdotto che l'output g della funzione Sigmoide può risolvere molto bene il problema delle due classificazioni, quindi abbiamo abilmente utilizzato la funzione Sigmoide per costruire il modello di regressione logistica f per risolvere le due- problema di classificazione.Mappare il set di funzionalità di input X sull'input z della funzione sigmoide utilizzando la regressione lineare o la regressione polinomialeImplementare l'output della funzione SigmoidQuindi calcolare l'output f (0 o 1) del modello di regressione logistica a seconda che il risultato dell'output della funzione sigmoide sia maggiore di 0,5., ottieni il risultato del problema delle due classificazioni.
  • Spiegazione della quinta riga: le idee di cui sopra possono essere integrate per ottenere il modello di regressione logistica f, in cui l'input del modello è l'insieme di caratteristiche X e l'output è il risultato previsto della classificazione 0 o 1.
  • Spiegazione della sesta riga: Quando il risultato di output del modello di regressione logistica è maggiore o uguale a 0,5, il valore previsto y^ è 1, il che significa che il tumore è un tumore maligno nell'esempio sopra quando il risultato di output di il modello di regressione logistica è inferiore o uguale a 0,5. Il valore previsto è 0, il che significa che il tumore non è maligno, utilizzando l'esempio precedente.

3. Confini della decisione

Da quanto sopra non è difficile dedurre che quando l'input z della funzione Sigmoide è maggiore o uguale a 0, cioè quando la mappatura z=wx+b dell'insieme di caratteristiche da X a z è maggiore o uguale a 0, il risultato di output del modello è 1; quando l'input z della funzione Sigmoide è inferiore a When 0, ovvero quando la mappatura z=wx+b dal set di funzionalità X a z è inferiore a 0, il risultato di output del modello è 0.
Questo è il concetto in base al quale possiamo elaborare i confini decisionali:L'equazione che rende la mappatura dell'input del modello X sull'input della funzione sigmoide z uguale a 0 è chiamata confine decisionale.

Prendendo come esempio il modello di previsione del tumore di cui sopra, la mappatura dall'input del modello X all'input della funzione sigmoide z è z=wx+b, quindi il limite decisionale è wx+b=0.

Usiamo un'immagine per illustrare il significato del confine decisionale:

  • Esempio 1:mappare una funzione lineare
    Inserisci qui la descrizione dell'immagine
    La figura sopra mostra il valore reale dell'etichetta quando le caratteristiche x1 e x2 nel set di addestramento hanno valori diversi. Il cerchio rappresenta il risultato della classificazione del campione come 0 e la croce rappresenta il risultato della classificazione del campione come 1.

    Il modello di regressione logistica è quello mostrato sopra, dove la mappatura dall'input del modello X all'input della funzione sigmoide z è z=w1x1+w2x2+b e il limite decisionale è w1x1+w2x2+b=0. Se i risultati dell'addestramento del modello sono w1=1, w2=1, b=-3, il limite decisionale è x1+x2-3=0 e l'immagine della funzione del limite decisionale è come mostrato nella figura sopra,Si può vedere che se le caratteristiche del campione si trovano sul lato sinistro del confine decisionale, la previsione della regressione logistica è 0, altrimenti è 1. Questo è il significato dell'immagine del confine decisionale.

  • Esempio 2:Mappare una funzione polinomiale
    Inserisci qui la descrizione dell'immagine
    La mappatura dall'input del modelloLa posizione delle caratteristiche del campione rispetto al confine decisionale determina il risultato della previsione del campione.

4. Processo di formazione del modello di regressione logistica:

In realtà, è uguale al processo di addestramento alla regressione lineare, tranne per il fatto che il modello (funzione) da addestrare è diverso.

1. Obiettivi formativi:

Inserisci qui la descrizione dell'immagine

2. Parametri di regolazione della discesa del gradiente:

Inserisci qui la descrizione dell'immagine