Teknologian jakaminen

Logistinen regressiomalli (ei regressioongelma, vaan binäärinen luokitusongelma)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Sigmoidin aktivointitoiminto:

Sigmoid-funktio on tärkeä aktivointifunktio logistisen regressiomallin rakentamisessa, kuten alla olevasta kuvasta näkyy.
Lisää kuvan kuvaus tähän

  • kaksiLuokitteluongelman tavoitteena on ohjata mallin lähtöä alueella [0,1], kun mallin tulos on <0,5, oletusennustetulos on 0, kun mallin tulos on > 0,5, oletusennustetulos on 1.
  • Ajatuksena binääriluokitteluongelman ratkaisemiseksi on kartoittaa binääriluokitteluongelman syöte x sigmoidifunktion syötteeseen z rakentamalla logistinen regressiomalli f laskemaan tuotos g ja saada sitten logistisen regressiomallin tulos. g:n alueen perusteella (onko se suurempi kuin 0,5) ( Toisin sanoen kahden luokitteluongelman tulos).
  • Toiminto ∈ R, arvoalue ∈ [0,1], milloinSyötä z<0Milloin, Sogmoid-toimintoTulostustulos g<0,5,Oletus onTulos on 0, muodostaaBinääriluokitteluongelman ensimmäinen luokka .kunSyötä z>0Milloin, Sogmoid-toimintoTulostus g>0,5,Oletus onTuloksena on 1, muodostaaBinääriluokitteluongelman toinen luokka

2. Johdatus logistiseen regressioon:

Ratkaisussa käytetään logistista regressiotaKaksi luokitteluongelmaa . Luokitteluongelmia varten mallista on vain rajallinen määrä tulostuloksia (regressioongelmia varten niitä on ääretön).Binääriluokitteluongelmassa mallin tulostuloksia on vain kaksi.

Klassisessa regressioongelman "Tumor Prediction Case" tapauksessa kasvaimen kokoominaisuutta käytetään ennustamaan, onko kasvain pahanlaatuinen kasvain. Tulostuloksia on vain kaksi: kyllä ​​(1) tai ei (0).
Lisää kuvan kuvaus tähän
Tällä hetkellä harjoitussarjaa on vaikea sovittaa lineaarisen regressiomallin avulla.(Lineaarinen regressio ratkaisee regressio-ongelman, kun taas kasvaimen ennustetapaus on luokitteluongelma tai binääriluokitteluongelma, tarkemmin sanottuna), joten logistisen regression idea ehdotettiin.
Lisää kuvan kuvaus tähän
Logistinen regressiomalli (ratkaise luokitusongelmat): syötä ominaisuus tai ominaisuusjoukko X ja tulosta numero väliltä 0 ja 1 , jossa sovituskäyrä muodostetaan Sogmoid-funktiolla. Erityinen rakennusprosessi on seuraava:
Lisää kuvan kuvaus tähän
Lisää kuvan kuvaus tähän

  • Ensimmäinen rivi selittää:Logistinen regressiomalli fMuodosta synlineaarinen regressio byTuloominaisuusjoukko X ja lähdön ennustustulos f, ero on siinäf arvoalue∈[0,1]
  • Toisen, kolmannen ja neljännen rivin selitys: Aiemmin esitimme, että Sigmoid-funktion lähtö g voi ratkaista kahden luokittelun ongelman erittäin hyvin, joten käytimme fiksusti Sigmoid-funktiota logistisen regressiomallin f ratkaisemiseksi. luokitteluongelma.Yhdistä syöttöominaisuusjoukko X sigmoidifunktion syötteeseen z käyttämällä lineaarista regressiota tai polynomiregressiotaToteuta Sigmoid-funktion tulosLaske sitten logistisen regressiomallin tulos f (0 tai 1) sen perusteella, onko sigmoidifunktion tulos suurempi kuin 0,5., saat kahden luokitusongelman tuloksen.
  • Viidennen rivin selitys: Yllä olevat ideat voidaan integroida niin, että saadaan logistinen regressiomalli f, jossa mallin syöte on ominaisuusjoukko X ja tulos on luokituksen 0 tai 1 ennustettu tulos.
  • Kuudennen rivin selitys: Kun logistisen regressiomallin tulos on suurempi tai yhtä suuri kuin 0,5, ennustettu arvo y^ on 1, mikä tarkoittaa, että kasvain on pahanlaatuinen kasvain yllä olevassa esimerkissä logistinen regressiomalli on pienempi tai yhtä suuri kuin 0,5. Ennustettu arvo on 0, mikä tarkoittaa, että kasvain ei ole pahanlaatuinen yllä olevalla esimerkillä.

3. Päätöksen rajat

Yllä olevasta ei ole vaikea päätellä, että kun Sigmoid-funktion syöte z on suurempi tai yhtä suuri kuin 0, eli kun ominaisuusjoukon X:n kuvaus z=wx+b on suurempi tai yhtä suuri kuin 0, mallin tulos on 1, kun Sigmoid-funktion tulo z on pienempi kuin Kun 0, eli kun kartoitus z=wx+b piirrejoukosta X arvoon z on pienempi kuin 0, tulostulos on; mallista on 0.
Tämä on käsite, jonka avulla voimme keksiä päätösrajat:Yhtälöä, joka tekee mallin syötteen X yhdistämisestä sigmoidifunktion syötteeseen z yhtä kuin 0, kutsutaan päätösrajaksi.

Esimerkkinä yllä olevasta kasvaimen ennustemallista kartoitus mallin syötteestä X sigmoidifunktion tuloon z on z=wx+b, jolloin päätösraja on wx+b=0.

Havainnollistakaamme päätösrajan merkitystä kuvaan:

  • esimerkki 1:kartta lineaarifunktioon
    Lisää kuvan kuvaus tähän
    Yllä oleva kuva näyttää etiketin todellisen arvon, kun harjoitusjoukon ominaisuuksilla x1 ja x2 on eri arvot Ympyrä edustaa näytteen luokittelutulosta 0:na ja risti näytteen luokittelutulosta 1.

    Logistinen regressiomalli on yllä esitetyn kaltainen, jossa kartoitus mallin syötteestä X sigmoidifunktion tuloon z on z=w1x1+w2x2+b ja päätösraja on w1x1+w2x2+b=0. Jos mallin harjoittelun tulokset ovat w1=1, w2=1, b=-3, päätösraja on x1+x2-3=0 ja päätösrajan funktiokuva on yllä olevan kuvan mukainen,Voidaan nähdä, että jos otoksen ominaisuudet sijaitsevat päätösrajan vasemmalla puolella, logistisen regression ennuste on 0, muuten se on 1. Tämä on päätösrajan kuvamerkitys.

  • Esimerkki 2:Yhdistä polynomifunktioon
    Lisää kuvan kuvaus tähän
    Karttaus mallin syötteestäOtoksen ominaisuuksien sijainti suhteessa päätösrajaan määrää näytteen ennustetuloksen.

4. Logistisen regressiomallin koulutusprosessi:

Itse asiassa se on sama kuin lineaarisen regression harjoitusprosessi, paitsi että opetettava malli (funktio) on erilainen.

1. Koulutuksen tavoitteet:

Lisää kuvan kuvaus tähän

2. Gradientin laskun säätöparametrit:

Lisää kuvan kuvaus tähän