Condivisione della tecnologia

La prima settimana del quarto corso Reti Neurali Convoluzionali

2024-07-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

La prima settimana del quarto corso Reti Neurali Convoluzionali

1.1 Problemi riscontrati nella visione artificiale (Computer vision)

Una sfida quando si applica la visione artificiale èinserimento datiPuò essere molto grande.

  • La dimensione dei dati di una piccola immagine 64×64 è 64×64×3 (3 canali di colore).Quindi il nostro autovettore XXIXLa dimensione è 12288.
  • Per un'immagine 1000×1000, la dimensione del vettore delle caratteristiche raggiunge 1000×1000×3.
  • Se ci sono 1000 unità nascoste nel primo strato nascosto e tutti i pesi formano una matrice La [ 1 ] La^{[1]}L'[1] . La dimensione di questa matrice in una rete standard completamente connessa è 1000×3 milioni. Per fare ciò, dobbiamo eseguire un calcolo di convoluzione,

Inserisci qui la descrizione dell'immagine

1.2 Esempio di operazione di convoluzione: esempio di rilevamento dei bordi

L'operazione di convoluzione è il componente più basilare della rete neurale convoluzionale e viene utilizzato come esempio introduttivo.

Inserisci qui la descrizione dell'immagine

1.2.1 Passaggi di rilevamento dei bordi

Quando rileviamo oggetti immagine, possiamo rilevare i bordi verticali nell'immagine.
Inserisci qui la descrizione dell'immagine

Scatta un'immagine in scala di grigi 6×6. Poiché è un'immagine in scala di grigi, è una matrice 6×6×1,

  • Per rilevare i bordi verticali in un'immagine, puoi costruire una matrice 3x3 (filtro/kernel) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] inizio{matriceb}1