1.1 Masalah yang ditemui pada visi komputer (Computer vision)
Salah satu tantangan ketika menerapkan visi komputer adalahmasukan dataIni bisa sangat besar.
Ukuran data gambar kecil 64×64 adalah 64×64×3 (3 saluran warna).Jadi vektor eigen kita ukuran besarXDimensinya adalah 12288.
Untuk gambar 1000×1000, dimensi vektor fiturnya mencapai 1000×1000×3.
Jika terdapat 1000 unit tersembunyi pada lapisan tersembunyi pertama, dan semua bobotnya membentuk matriks Saya [ 1 ] Saya^{[1]}Kami[1] . Ukuran matriks ini di bawah jaringan standar yang terhubung penuh adalah 1000×3 juta. Untuk melakukan ini, kita perlu melakukan perhitungan konvolusi,
1.2 Contoh operasi konvolusi: Contoh deteksi tepi
Operasi konvolusi adalah komponen paling dasar dari jaringan saraf konvolusional. Deteksi tepi digunakan sebagai contoh pengantar.
1.2.1 Langkah-langkah deteksi tepi
Saat mendeteksi objek gambar, kita dapat mendeteksi tepi vertikal pada gambar.
Ambil gambar skala abu-abu 6×6. Karena merupakan gambar skala abu-abu, maka matriksnya berukuran 6×6×1,
Untuk mendeteksi tepi vertikal pada gambar, Anda dapat membuat matriks 3x3 (filter/kernel) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] mulai{bmatrix}1