Berbagi teknologi

Model regresi logistik (bukan masalah regresi, tapi masalah klasifikasi biner)

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1. Fungsi aktivasi sigmoid:

Fungsi Sigmoid merupakan fungsi aktivasi penting untuk membangun model regresi logistik, seperti yang ditunjukkan pada gambar di bawah.
Masukkan deskripsi gambar di sini

  • duaTujuan dari masalah klasifikasi adalah untuk mengontrol keluaran model dalam kisaran [0,1], bila hasil keluaran model <0,5 maka hasil prediksi defaultnya adalah 0; bila hasil keluaran model >0,5 maka hasil prediksi defaultnya adalah 1.
  • Ide untuk menyelesaikan masalah klasifikasi biner adalah dengan memetakan input x dari masalah klasifikasi biner ke input z dari fungsi Sigmoid dengan membuat model regresi logistik f untuk menghitung output g, dan kemudian memperoleh hasil model regresi logistik berdasarkan kisaran g (apakah lebih besar dari 0,5) ( Artinya, hasil dari masalah dua klasifikasi).
  • Domain fungsi ∈ R, rentang nilai ∈ [0,1], kapanMasukkan z<0Kapan, fungsi SogmoidHasil keluaran g<0,5, Standarnya adalahHasilnya adalah 0,merupakanKategori pertama dari masalah klasifikasi biner .KapanMasukkan z>0Kapan, fungsi SogmoidHasil keluaran g>0,5, Standarnya adalahHasilnya adalah 1,merupakanKategori kedua dari masalah klasifikasi biner

2. Pengantar regresi logistik:

Regresi logistik digunakan untuk menyelesaikannyaDua masalah klasifikasi . Untuk masalah klasifikasi, hasil keluaran dari model hanya terbatas (untuk masalah regresi ada yang tidak terbatas).Pada permasalahan klasifikasi biner, hanya terdapat dua hasil keluaran model.

Dalam kasus klasik masalah regresi “Kasus Prediksi Tumor”, fitur ukuran tumor digunakan untuk memprediksi apakah tumor tersebut merupakan tumor ganas, hanya ada dua hasil keluaran: ya (1) atau tidak (0).
Masukkan deskripsi gambar di sini
Saat ini, sulit untuk menyesuaikan set pelatihan menggunakan model regresi linier.(Regresi linier memecahkan masalah regresi, sedangkan kasus prediksi tumor adalah masalah klasifikasi, atau tepatnya masalah klasifikasi biner), sehingga ide regresi logistik diajukan.
Masukkan deskripsi gambar di sini
Model regresi logistik (menyelesaikan masalah klasifikasi): memasukkan fitur atau kumpulan fitur X dan mengeluarkan angka antara 0 dan 1 , di mana kurva pemasangan dibuat melalui fungsi Sogmoid. Proses konstruksi spesifiknya adalah sebagai berikut:
Masukkan deskripsi gambar di sini
Masukkan deskripsi gambar di sini

  • Baris pertama menjelaskan:Model regresi logistik fBangun regresi synlinear denganKumpulan fitur masukan X dan hasil prediksi keluaran f, perbedaannya adalah iturentang nilai f∈[0,1]
  • Penjelasan baris kedua, ketiga dan keempat: Sebelumnya kami telah memperkenalkan bahwa keluaran g dari fungsi Sigmoid dapat menyelesaikan masalah dua klasifikasi dengan sangat baik, jadi kami dengan cerdik menggunakan fungsi Sigmoid untuk membangun model regresi logistik f untuk menyelesaikan dua- masalah klasifikasi.Petakan kumpulan fitur masukan X ke masukan z fungsi Sigmoid menggunakan regresi linier atau regresi polinomialImplementasikan output dari fungsi SigmoidKemudian menghitung keluaran f (0 atau 1) model regresi logistik berdasarkan apakah hasil keluaran fungsi Sigmoid lebih besar dari 0,5., dapatkan hasil dari soal dua klasifikasi.
  • Penjelasan baris kelima: Ide-ide di atas dapat diintegrasikan untuk memperoleh model regresi logistik f, dimana masukan dari model tersebut adalah himpunan fitur X, dan keluarannya adalah hasil prediksi klasifikasi 0 atau 1.
  • Penjelasan baris keenam: Bila hasil keluaran model regresi logistik lebih besar atau sama dengan 0,5 maka nilai prediksi y^ adalah 1 yang artinya tumor tersebut adalah tumor ganas pada contoh di atas; model regresi logistik kurang dari atau sama dengan 0,5, Nilai prediksinya adalah 0 yang berarti tumor tersebut tidak ganas, menggunakan contoh di atas.

3. Batasan keputusan

Tidak sulit untuk mendapatkan dari penjelasan di atas bahwa ketika input z dari fungsi Sigmoid lebih besar dari atau sama dengan 0, yaitu ketika pemetaan z=wx+b dari himpunan fitur X ke z lebih besar dari atau sama dengan 0, hasil keluaran model adalah 1; bila masukan z dari fungsi Sigmoid kurang dari Ketika 0, yaitu bila pemetaan z=wx+b dari kumpulan fitur X ke z kurang dari 0, maka hasil keluarannya modelnya adalah 0.
Inilah konsep yang dapat digunakan untuk menentukan batasan keputusan:Persamaan yang membuat pemetaan masukan model X ke masukan fungsi Sigmoid z sama dengan 0 disebut batas keputusan.

Mengambil contoh model prediksi tumor di atas, pemetaan dari input model X ke input fungsi Sigmoid z adalah z=wx+b, maka batas keputusannya adalah wx+b=0.

Mari kita gunakan gambar untuk mengilustrasikan arti batas keputusan:

  • Contoh 1:memetakan ke fungsi linier
    Masukkan deskripsi gambar di sini
    Gambar di atas menunjukkan nilai sebenarnya dari label ketika fitur x1 dan x2 pada set pelatihan memiliki nilai yang berbeda. Lingkaran mewakili hasil klasifikasi sampel sebagai 0, dan tanda silang mewakili hasil klasifikasi sampel sebagai 1.

    Model regresi logistik seperti gambar di atas, dimana pemetaan dari input model X ke input fungsi Sigmoid z adalah z=w1x1+w2x2+b, dan batas keputusannya adalah w1x1+w2x2+b=0. Jika hasil pelatihan model adalah w1=1, w2=1, b=-3, maka batas keputusannya adalah x1+x2-3=0, dan gambaran fungsi batas keputusannya seperti terlihat pada gambar di atas,Terlihat jika ciri-ciri sampel terletak di sebelah kiri batas keputusan maka prediksi regresi logistiknya adalah 0, sebaliknya adalah 1. Inilah arti gambaran dari batas keputusan tersebut.

  • Contoh 2:Petakan ke fungsi polinomial
    Masukkan deskripsi gambar di sini
    Pemetaan dari input modelPosisi karakteristik sampel relatif terhadap batas keputusan menentukan hasil prediksi sampel.

4. Proses pelatihan model regresi logistik:

Sebenarnya sama dengan proses pelatihan regresi linier, hanya saja model (fungsi) yang akan dilatih berbeda.

1. Tujuan pelatihan:

Masukkan deskripsi gambar di sini

2. Parameter penyesuaian penurunan gradien:

Masukkan deskripsi gambar di sini