La prima settimana del quarto corso Convolutional Neural Network

2024-07-11

La prima settimana del quarto corso Reti Neurali Convoluzionali

Una sfida quando si applica la visione artificiale èinserimento datiPuò essere molto grande.

La dimensione dei dati di una piccola immagine 64×64 è 64×64×3 (3 canali di colore).Quindi il nostro autovettore $X$ La dimensione è 12288.
Per un'immagine 1000×1000, la dimensione del vettore delle caratteristiche raggiunge 1000×1000×3.
Se ci sono 1000 unità nascoste nel primo strato nascosto e tutti i pesi formano una matrice $La^{[1]}$ . La dimensione di questa matrice in una rete standard completamente connessa è 1000×3 milioni. Per fare ciò, dobbiamo eseguire un calcolo di convoluzione,

Inserisci qui la descrizione dell'immagine

L'operazione di convoluzione è il componente più basilare della rete neurale convoluzionale e viene utilizzato come esempio introduttivo.

Inserisci qui la descrizione dell'immagine

Quando rileviamo oggetti immagine, possiamo rilevare i bordi verticali nell'immagine.
Inserisci qui la descrizione dell'immagine

Scatta un'immagine in scala di grigi 6×6. Poiché è un'immagine in scala di grigi, è una matrice 6×6×1,

Per rilevare i bordi verticali in un'immagine, puoi costruire una matrice 3x3 (filtro/kernel)