le mie informazioni di contatto
Posta[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Attributo della colonna xJ | Numero di attributi n | x ⃗ vettore{x}X(io)vettore di riga | un certo valore x ⃗ ji vec{x}_j^iXJiooooooooSu e giù |
---|---|---|---|
significa μ | standardizzazione | Deviazione standard σ | sigma(σ) |
w ⃗ vettore{w}io = [la1 io2 io3 …]
x ⃗ vettore{x}X = [x1 X2 X3 …]
fw ⃗ , b ( x ⃗ ) = w ⃗ ∗ x ⃗ + b = w 1 x 1 + w 2 x 2 + … + wnxn + b f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + bFio,B(X)=io∗X+B=io1X1+io2X2+…+ioNXN+B
import numpy
f = np.dot(w, x) + b
Nota: è molto veloce quando n è grande (elaborazione parallela)
wn = wn − α 1 m ∑ i = 1 mfw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) xn ( i ) w_n = w_n - αdfrac{1}{m} sumlimits_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}ioN=ioN−αM1ioooooooo=1∑MFio,B(X(ioooooooo)−e(ioooooooo))XN(ioooooooo)
b = b − α 1 m ∑ i = 1 m ( fw ⃗ , b ( x ⃗ ( i ) − y ( i ) ) b = b - α{dfrac{1}{m}}sommalimiti_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})B=B−αM1ioooooooo=1∑M(Fio,B(X(ioooooooo)−e(ioooooooo))
Il peso corrispondente a un intervallo più ampio di variabili indipendenti tende ad essere inferiore, mentre il peso corrispondente a un intervallo più ristretto di variabili indipendenti tende ad essere maggiore.
Dividere per il valore massimo dell'intervallo per trovare il peso rispetto a [0, 1] della variabile indipendente
Ascissa: x 1 = x 1 − μ 1 2000 − 300 x_1 = dfrac{x_1-μ_1}{2000-300}X1=2000−300X1−μ1 Asse Y: x 2 = x 2 − μ 2 5 − 0 x_2 = dfrac{x_2 - μ_2}{5-0}X2=5−0X2−μ2
− 0,18 ≤ x 1 ≤ 0,82 -0,18le x_1le0,82−0.18≤X1≤0.82 − 0,46 ≤ x 2 ≤ 0,54 -0,46le x_2le0,54−0.46≤X2≤0.54
300 ≤ x 1 ≤ 2000 300le x_1le2000300≤X1≤2000 0 ≤ x 2 ≤ 5 0le x_2le50≤X2≤5
x 1 = x 1 − μ 1 σ 1 x1 = dfrac{x_1-μ_1}{σ_1}X1=σ1X1−μ1 − 0,67 ≤ x 1 ≤ 3,1 -0,67le x_1le3,1−0.67≤X1≤3.1
Cercare di mantenere i valori di tutte le caratteristiche entro un intervallo simile attraverso il ridimensionamento, in modo che l'impatto delle loro modifiche sui valori previsti sia vicino a (-3,3)
Se la funzione di costo J diventa grande, significa che la dimensione del passo (tasso di apprendimento) è inappropriata o il codice è sbagliato.
Nota: il numero di iterazioni varia da macchina a macchina
Oltre a disegnare curve per determinare il punto di iterazione, è possibile utilizzare anche il test di convergenza automatico
Sia ε uguale
1
0
−
3
10^{-3}
10−3, se la diminuzione di J è inferiore a questo piccolo numero, si considera convergente.
Costruisci l'ingegneria delle funzionalità attraverso la trasformazione o la combinazione per offrire più opzioni
fw ⃗ , b ( x ⃗ ) = w 1 x 1 + w 2 x 2 + w 3 x 3 + b f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+bFio,B(X)=io1X1+io2X2+io3X3+B
Nota: la regressione polinomiale può essere utilizzata per l'adattamento lineare e non lineare