SyväoppiminenSyväoppiminen Multiple Lineaar Regression Study Notes

SyväoppiminenSyväoppiminen Useita lineaarisia regressiotutkimuksia koskevia huomautuksia

2024-07-12

Artikkelihakemisto

- Moniulotteiset ominaisuudet

Moniulotteiset ominaisuudet

Muuttujat ja ehdot

Sarakkeen attribuutti x_j	Attribuuttien lukumäärä n	$x$ ⁽ⁱ⁾rivivektori	tietty arvo $vec{x}_j^i$ Ylös ja alas
tarkoittaa μ	standardointi	Keskihajonta σ	sigma (σ)

kaava

$w$ = [w₁ w₂ w₃ …]
$x$ = [x₁ x₂ x₃ …]

$f_{vec{w},b} (vec{x}) = vec{ w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + b$

moninkertainen lineaarinen regressio

import numpy
f = np.dot(w, x) + b
1
2

Huomautus: Se on erittäin nopea, kun n on suuri (rinnakkaiskäsittely)

normaali yhtälömenetelmä

Yli 1000 on tehotonta
Sitä ei voida yleistää muihin algoritmeihin, kuten logistiseen regressioon, hermoverkkoihin tai muihin.
ei iteraatiota

$w_n = w_n - αdfrac{1}{m} sumlimits_{i=1}^mf_ {vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}$

$α{dfrac{1}{m}}sumlimits_{i=1}^ m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})$

Suuremmalla alueella riippumattomia muuttujia vastaavat painot ovat yleensä pienempiä, ja pienemmällä alueella riippumattomia muuttujia vastaavat painot ovat yleensä suurempia.

Tarkoittaa normalisointia

Jakamalla alueen maksimiarvolla saat selville riippumattoman muuttujan painon vs. [0, 1]

Abskissa: $x_1 = dfrac{x_1-μ_1}{2000-300}$ Y-akseli: $x_2 = dfrac{x_2 - μ_2}{5-0}$

$x_1le0,82$ $x_2le0,54$

Z-pisteiden normalisointi

$x_1le2000$ $x_2le5$

$dfrac{x_1-μ_1}{σ_1}$ $x_1 le3,1$

Pyri pitämään kaikkien ominaisuuksien arvot samalla alueella skaalauksen avulla, jotta niiden muutosten vaikutus ennustettuihin arvoihin on lähellä (-3,3)

Jos kustannusfunktio J kasvaa suureksi, se tarkoittaa, että askelkoko (oppimisnopeus) on sopimaton tai koodi on väärä.

Lisää kuvan kuvaus tähän

Huomautus: Iteraatioiden määrä vaihtelee koneittain

Käyrien piirtämisen lisäksi iteraatiopisteen määrittämiseksi voidaan käyttää myös automaattista konvergenssitestausta
Olkoon ε yhtä suuri $10^{-3}$ , jos J:n lasku on pienempi kuin tämä pieni luku, sen katsotaan konvergoivan.

Aseta sopiva oppimisnopeus

Testattaessa voit asettaa hyvin pienen arvon nähdäksesi, pieneneekö J.
Oppimisnopeus iteroinnin aikana ei saa olla liian suuri tai liian pieni.
Valitse aina * 3 testauksen aikana mahdollisimman suuri oppimisnopeus tai hieman pienempi kuin kohtuullinen arvo

Ominaisuussuunnittelu

Rakenna ominaisuussuunnittelua muunnoksen tai yhdistelmän avulla tarjotaksesi enemmän vaihtoehtoja

$f_{vec{w},b}(vec{x}) = w_1x_1+l_2x_2+w_3x_3+b$

Huomautus: Polynomiregressiota voidaan käyttää lineaariseen ja epälineaariseen sovitukseen

Teknologian jakaminen