Глубокое обучениеПримечания к исследованию множественной линейной регрессии DeepLearning

Глубокое обучениеDeepLearning Примечания к исследованию множественной линейной регрессии

2024-07-12

Каталог статей

- Многомерные функции

Многомерные функции

Переменные и термины

Атрибут столбца x_дж	Количество атрибутов n	$Икс$ ^(я)вектор-строка	определенное значение $век{x}_j^i$ Вверх и вниз
среднее значение μ	стандартизация	Стандартное отклонение σ	сигма (σ)

формула

$ж$ = [w₁ ж₂ ж₃ …]
$Икс$ = [х₁ Икс₂ Икс₃ …]

$f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + b$

множественная линейная регрессия

import numpy
f = np.dot(w, x) + b
1
2

Примечание. Когда n велико (параллельная обработка), это происходит очень быстро.

метод нормальных уравнений

Больше 1000 неэффективно
Его нельзя обобщить на другие алгоритмы, такие как логистическая регрессия, нейронные сети и другие.
нет итерации

$w_n = w_n - αdfrac{1}{m} предел_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}$

$α{dfrac{1}{m}}sumlimits_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})$

Вес, соответствующий более широкому диапазону независимых переменных, имеет тенденцию быть меньшим, а соответствующий вес меньшему диапазону независимых переменных имеет тенденцию быть больше.

Нормализация среднего

Разделите на максимальное значение диапазона, чтобы найти вес независимой переменной в зависимости от [0, 1]

Абсцисса: $x_1 = dfrac{x_1-μ_1}{2000-300}$ Ось Y: $x_2 = dfrac{x_2 - μ_2}{5-0}$

$x_1le0,82$ $x_2le0,54$

Нормализация Z-оценки

$x_1le2000$ $x_2le5$

$dfrac{x_1-μ_1}{σ_1}$ $x_1le3,1$

Постарайтесь сохранить значения всех признаков в одном диапазоне посредством масштабирования, чтобы влияние их изменений на прогнозируемые значения было близко к (-3,3).

Если функция стоимости J становится большой, это означает, что размер шага (скорость обучения) неподходящий или код неправильный.

Вставьте сюда описание изображения

Примечание. Количество итераций варьируется от машины к машине.

Помимо построения кривых для определения точки итерации, также можно использовать автоматическое тестирование сходимости.
Пусть ε равно $10^{-3}$ , если уменьшение J меньше этого небольшого числа, оно считается сходящимся.

Установите подходящую скорость обучения

При тестировании вы можете установить очень маленькое значение, чтобы увидеть, уменьшится ли J.
Скорость обучения во время итерации не должна быть слишком большой или слишком маленькой.
Каждый раз * 3 во время тестирования выбирайте максимально большую скорость обучения или немного меньшую разумного значения.

Особенности инжиниринга

Создавайте функции проектирования с помощью преобразований или комбинаций, чтобы предоставить вам больше возможностей.

$f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+b$

Примечание. Полиномиальную регрессию можно использовать для линейной и нелинейной аппроксимации.

Обмен технологиями