2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Spaltenattribut xJ | Anzahl der Attribute n | x ⃗ vec{x}X(ich)Zeilenvektor | einen bestimmten Wert x ⃗ ji vec{x}_j^iXJichchchchchchchchAuf und ab |
---|---|---|---|
bedeuten μ | Standardisierung | Standardabweichung σ | Sigma (σ) |
w ⃗ vec{w}m = [w1 m2 m3 …]
x ⃗ vec{x}X = [x1 X2 X3 …]
fw ⃗ , b ( x ⃗ ) = w ⃗ ∗ x ⃗ + b = w 1 x 1 + w 2 x 2 + … + wnxn + b f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + bFm,B(X)=m∗X+B=m1X1+m2X2+…+mNXN+B
import numpy
f = np.dot(w, x) + b
Hinweis: Es ist sehr schnell, wenn n groß ist (parallele Verarbeitung).
wn = wn − α 1 m ∑ i = 1 mfw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) xn ( i ) w_n = w_n - αdfrac{1}{m} sumlimits_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}mN=mN−αM1ichchchchchchchch=1∑MFm,B(X(ichchchchchchchch)−j(ichchchchchchchch))XN(ichchchchchchchch)
b = b − α 1 m ∑ i = 1 m ( fw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) b = b - α{dfrac{1}{m}}sumlimits_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})B=B−αM1ichchchchchchchch=1∑M(Fm,B(X(ichchchchchchchch)−j(ichchchchchchchch))
Die Gewichtung, die einem größeren Bereich unabhängiger Variablen entspricht, ist tendenziell kleiner, und die entsprechende Gewichtung eines kleineren Bereichs unabhängiger Variablen ist tendenziell größer.
Teilen Sie durch den Maximalwert des Bereichs, um die Gewichtung gegenüber [0, 1] der unabhängigen Variablen zu ermitteln
Abszisse: x 1 = x 1 − μ 1 2000 − 300 x_1 = dfrac{x_1-μ_1}{2000-300}X1=2000−300X1−μ1 Y-Achse: x 2 = x 2 − μ 2 5 − 0 x_2 = dfrac{x_2 - μ_2}{5-0}X2=5−0X2−μ2
− 0,18 ≤ x 1 ≤ 0,82 -0,18le x_1le0,82−0.18≤X1≤0.82 − 0,46 ≤ x 2 ≤ 0,54 -0,46le x_2le0,54−0.46≤X2≤0.54
300 ≤ x 1 ≤ 2000 300le x_1le2000300≤X1≤2000 0 ≤ x 2 ≤ 5 0le x_2le50≤X2≤5
x 1 = x 1 − μ 1 σ 1 x1 = dfrac{x_1-μ_1}{σ_1}X1=σ1X1−μ1 − 0,67 ≤ x 1 ≤ 3,1 -0,67le x_1le3,1−0.67≤X1≤3.1
Versuchen Sie, die Werte aller Features durch Skalierung in einem ähnlichen Bereich zu halten, sodass die Auswirkung ihrer Änderungen auf die vorhergesagten Werte nahe bei (-3,3) liegt.
Wenn die Kostenfunktion J groß wird, bedeutet dies, dass die Schrittgröße (Lernrate) ungeeignet ist oder der Code falsch ist.
Hinweis: Die Anzahl der Iterationen variiert von Maschine zu Maschine
Zusätzlich zum Zeichnen von Kurven zur Bestimmung des Iterationspunkts können auch automatische Konvergenztests verwendet werden
Sei ε gleich
1
0
−
3
10^{-3}
10−3Wenn die Abnahme von J kleiner als diese kleine Zahl ist, wird davon ausgegangen, dass sie konvergiert.
Erstellen Sie Feature Engineering durch Transformation oder Kombination, um mehr Optionen zu bieten
fw ⃗ , b ( x ⃗ ) = w 1 x 1 + w 2 x 2 + w 3 x 3 + b f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+bFm,B(X)=m1X1+m2X2+m3X3+B
Hinweis: Die Polynomregression kann für die lineare und nichtlineare Anpassung verwendet werden