2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Sarakkeen attribuutti xj | Attribuuttien lukumäärä n | x ⃗ vec{x}x(i)rivivektori | tietty arvo x ⃗ ji vec{x}_j^ixjiYlös ja alas |
---|---|---|---|
tarkoittaa μ | standardointi | Keskihajonta σ | sigma (σ) |
w ⃗ vec{w}w = [w1 w2 w3 …]
x ⃗ vec{x}x = [x1 x2 x3 …]
fw ⃗ , b ( x ⃗ ) = w ⃗ ∗ x ⃗ + b = w 1 x 1 + w 2 x 2 + … + wnxn + b f_{vec{w},b} (vec{x}) = vec{ w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + bfw,b(x)=w∗x+b=w1x1+w2x2+…+wnxn+b
import numpy
f = np.dot(w, x) + b
Huomautus: Se on erittäin nopea, kun n on suuri (rinnakkaiskäsittely)
wn = wn − α 1 m ∑ i = 1 mfw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) xn ( i ) w_n = w_n - αdfrac{1}{m} sumlimits_{i=1}^mf_ {vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}wn=wn−αm1i=1∑mfw,b(x(i)−y(i))xn(i)
b = b − α 1 m ∑ i = 1 m ( fw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) b = b - α{dfrac{1}{m}}sumlimits_{i=1}^ m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})b=b−αm1i=1∑m(fw,b(x(i)−y(i))
Suuremmalla alueella riippumattomia muuttujia vastaavat painot ovat yleensä pienempiä, ja pienemmällä alueella riippumattomia muuttujia vastaavat painot ovat yleensä suurempia.
Jakamalla alueen maksimiarvolla saat selville riippumattoman muuttujan painon vs. [0, 1]
Abskissa: x 1 = x 1 − μ 1 2000 − 300 x_1 = dfrac{x_1-μ_1}{2000-300}x1=2000−300x1−μ1 Y-akseli: x 2 = x 2 − μ 2 5 − 0 x_2 = dfrac{x_2 - μ_2}{5-0}x2=5−0x2−μ2
− 0,18 ≤ x 1 ≤ 0,82 -0,18 le x_1le0,82−0.18≤x1≤0.82 − 0,46 ≤ x 2 ≤ 0,54 -0,46 le x_2le0,54−0.46≤x2≤0.54
300 ≤ x 1 ≤ 2000 300le x_1le2000300≤x1≤2000 0 ≤ x 2 ≤ 5 0le x_2le50≤x2≤5
x 1 = x 1 − μ 1 σ 1 x1 = dfrac{x_1-μ_1}{σ_1}x1=σ1x1−μ1 − 0,67 ≤ x 1 ≤ 3,1 -0,67 le x_1 le3,1−0.67≤x1≤3.1
Pyri pitämään kaikkien ominaisuuksien arvot samalla alueella skaalauksen avulla, jotta niiden muutosten vaikutus ennustettuihin arvoihin on lähellä (-3,3)
Jos kustannusfunktio J kasvaa suureksi, se tarkoittaa, että askelkoko (oppimisnopeus) on sopimaton tai koodi on väärä.
Huomautus: Iteraatioiden määrä vaihtelee koneittain
Käyrien piirtämisen lisäksi iteraatiopisteen määrittämiseksi voidaan käyttää myös automaattista konvergenssitestausta
Olkoon ε yhtä suuri
1
0
−
3
10^{-3}
10−3, jos J:n lasku on pienempi kuin tämä pieni luku, sen katsotaan konvergoivan.
Rakenna ominaisuussuunnittelua muunnoksen tai yhdistelmän avulla tarjotaksesi enemmän vaihtoehtoja
fw ⃗ , b ( x ⃗ ) = le 1 x 1 + le 2 x 2 + le 3 x 3 + b f_{vec{w},b}(vec{x}) = w_1x_1+l_2x_2+w_3x_3+bfw,b(x)=w1x1+w2x2+w3x3+b
Huomautus: Polynomiregressiota voidaan käyttää lineaariseen ja epälineaariseen sovitukseen