Deep LearningDeepLearning Multiple Linear Regression Study Notes

Deep LearningDeepLearning-Studiennotizen zur multiplen linearen Regression

2024-07-12

Artikelverzeichnis

- Mehrdimensionale Merkmale

Mehrdimensionale Merkmale

Variablen und Begriffe

Spaltenattribut x_J	Anzahl der Attribute n	$X$ ^(ich)Zeilenvektor	einen bestimmten Wert $vec{x}_j^i$ Auf und ab
bedeuten μ	Standardisierung	Standardabweichung σ	Sigma (σ)

Formel

$m$ = [w₁ m₂ m₃ …]
$X$ = [x₁ X₂ X₃ …]

$f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + b$

multiple lineare Regression

import numpy
f = np.dot(w, x) + b
1
2

Hinweis: Es ist sehr schnell, wenn n groß ist (parallele Verarbeitung).

Normalgleichungsmethode

Mehr als 1000 sind ineffizient
Es kann nicht auf andere Algorithmen wie logistische Regression, neuronale Netze oder andere verallgemeinert werden.
keine Iteration

$w_n = w_n - αdfrac{1}{m} sumlimits_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}$

$α{dfrac{1}{m}}sumlimits_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})$

Die Gewichtung, die einem größeren Bereich unabhängiger Variablen entspricht, ist tendenziell kleiner, und die entsprechende Gewichtung eines kleineren Bereichs unabhängiger Variablen ist tendenziell größer.

Mittelwertnormalisierung

Teilen Sie durch den Maximalwert des Bereichs, um die Gewichtung gegenüber [0, 1] der unabhängigen Variablen zu ermitteln

Abszisse: $x_1 = dfrac{x_1-μ_1}{2000-300}$ Y-Achse: $x_2 = dfrac{x_2 - μ_2}{5-0}$

$x_1le0,82$ $x_2le0,54$

Z-Score-Normalisierung

$x_1le2000$ $x_2le5$

$dfrac{x_1-μ_1}{σ_1}$ $x_1le3,1$

Versuchen Sie, die Werte aller Features durch Skalierung in einem ähnlichen Bereich zu halten, sodass die Auswirkung ihrer Änderungen auf die vorhergesagten Werte nahe bei (-3,3) liegt.

Wenn die Kostenfunktion J groß wird, bedeutet dies, dass die Schrittgröße (Lernrate) ungeeignet ist oder der Code falsch ist.

Fügen Sie hier eine Bildbeschreibung ein

Hinweis: Die Anzahl der Iterationen variiert von Maschine zu Maschine

Zusätzlich zum Zeichnen von Kurven zur Bestimmung des Iterationspunkts können auch automatische Konvergenztests verwendet werden
Sei ε gleich $10^{-3}$ Wenn die Abnahme von J kleiner als diese kleine Zahl ist, wird davon ausgegangen, dass sie konvergiert.

Legen Sie eine angemessene Lernrate fest

Beim Testen können Sie einen sehr kleinen Wert einstellen, um zu sehen, ob J abnimmt.
Die Lernrate während der Iteration sollte nicht zu groß oder zu klein sein.
Wählen Sie jedes Mal * 3 während des Tests eine Lernrate, die so groß wie möglich oder etwas kleiner als ein angemessener Wert ist

Funktionsentwicklung

Erstellen Sie Feature Engineering durch Transformation oder Kombination, um mehr Optionen zu bieten

$f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+b$

Hinweis: Die Polynomregression kann für die lineare und nichtlineare Anpassung verwendet werden

Technologieaustausch