Pembelajaran MendalamDeepLearning Catatan Studi Regresi Linier Berganda

2024-07-12

Direktori artikel

- Fitur multidimensi

Fitur multidimensi

Variabel dan Ketentuan

Atribut kolom x_J	Jumlah atribut n	$X$ ^(Saya)vektor baris	nilai tertentu $vec{x}_j^i$ Naik dan turun
berarti μ	standardisasi	Simpangan baku σ	sigma (σ)

rumus

$aku$ = [kamu]₁ aku₂ aku₃ …]
$X$ = [x₁ X₂ X₃ …]

$f_{vec{w},b} (vec{x}) = vec{w} * vec{x} + b = w_1x_1 + w_2x_2 + … + w _nx_n + b$

regresi linier berganda

import numpy
f = np.dot(w, x) + b
1
2

Catatan: Ini sangat cepat ketika n besar (pemrosesan paralel)

metode persamaan normal

Lebih dari 1000 tidak efisien
Ini tidak dapat digeneralisasikan ke algoritma lain seperti regresi logistik, jaringan saraf atau lainnya.
tidak ada iterasi

$w_n = w_n - αdfrac{1}{m} sumlimit_{i=1}^mf_{vec{w},b}(vec{x}^{(i)}-y^{(i)})x_n^{(i)}$

$limit_{i=1}^m(f_{vec{w},b}(vec{x}^{(i)}-y^{(i)})$

Bobot yang terkait dengan rentang variabel independen yang lebih besar cenderung lebih kecil, dan bobot yang terkait dengan rentang variabel independen yang lebih kecil cenderung lebih besar.

Normalisasi rata-rata

Bagilah dengan nilai maksimum rentang untuk mencari bobot versus [0, 1] variabel independen

Absis: $x_1 = frak{x_1-μ_1}{2000-300}$ sumbu Y: $x_2 = frak{x_2 - μ_2}{5-0}$

$x_1le0,82$ $x_2le0,54$

Normalisasi skor Z

$x_1le2000$ $x_2le5$

$frak{x_1-μ_1}{σ_1}$ $x_1le3,1$

Usahakan untuk menjaga nilai semua fitur dalam rentang yang sama melalui penskalaan, sehingga dampak perubahannya terhadap nilai prediksi mendekati (-3,3)

Jika fungsi biaya J menjadi besar berarti ukuran langkah (learning rate) tidak sesuai atau kodenya salah.

Masukkan deskripsi gambar di sini

Catatan: Jumlah iterasi bervariasi dari mesin ke mesin

Selain menggambar kurva untuk menentukan titik iterasi, pengujian konvergensi otomatis juga dapat digunakan
Biarkan ε sama $10^{-3}$ , jika penurunan J kurang dari angka kecil tersebut maka dianggap konvergen.

Tetapkan kecepatan pembelajaran yang sesuai

Saat menguji, Anda dapat menetapkan nilai yang sangat kecil untuk melihat apakah J berkurang.
Kecepatan pembelajaran selama iterasi tidak boleh terlalu besar atau terlalu kecil.
Setiap kali *3 selama pengujian, pilih kecepatan pemelajaran sebesar mungkin, atau sedikit lebih kecil dari nilai wajar

Rekayasa fitur

Bangun rekayasa fitur melalui transformasi atau kombinasi untuk memberikan lebih banyak opsi

$f_{vec{w},b}(vec{x}) = w_1x_1+w_2x_2+w_3x_3+b$

Catatan: Regresi polinomial dapat digunakan untuk pemasangan linier dan nonlinier

Berbagi teknologi