1.1 Problemi riscontrati nella visione artificiale (Computer vision)
Una sfida quando si applica la visione artificiale èinserimento datiPuò essere molto grande.
La dimensione dei dati di una piccola immagine 64×64 è 64×64×3 (3 canali di colore).Quindi il nostro autovettore XXIXLa dimensione è 12288.
Per un'immagine 1000×1000, la dimensione del vettore delle caratteristiche raggiunge 1000×1000×3.
Se ci sono 1000 unità nascoste nel primo strato nascosto e tutti i pesi formano una matrice La [ 1 ] La^{[1]}L'[1] . La dimensione di questa matrice in una rete standard completamente connessa è 1000×3 milioni. Per fare ciò, dobbiamo eseguire un calcolo di convoluzione,
1.2 Esempio di operazione di convoluzione: esempio di rilevamento dei bordi
L'operazione di convoluzione è il componente più basilare della rete neurale convoluzionale e viene utilizzato come esempio introduttivo.
1.2.1 Passaggi di rilevamento dei bordi
Quando rileviamo oggetti immagine, possiamo rilevare i bordi verticali nell'immagine.
Scatta un'immagine in scala di grigi 6×6. Poiché è un'immagine in scala di grigi, è una matrice 6×6×1,
Per rilevare i bordi verticali in un'immagine, puoi costruire una matrice 3x3 (filtro/kernel) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] inizio{matriceb}1