1.1 Probleme beim Computer Vision (Computer Vision)
Eine Herausforderung bei der Anwendung von Computer Vision istDateneingabeEs kann sehr groß sein.
Die Datengröße eines 64×64 Kleinbildes beträgt 64×64×3 (3 Farbkanäle).Also unser Eigenvektor xxXDie Dimension ist 12288.
Bei einem 1000×1000-Bild erreicht die Dimension des Merkmalsvektors 1000×1000×3.
Wenn die erste verborgene Ebene 1000 verborgene Einheiten enthält und alle Gewichte eine Matrix bilden W [ 1 ] W^{[1]}B[1] . Die Größe dieser Matrix beträgt in einem standardmäßigen, vollständig verbundenen Netzwerk 1000 x 3 Millionen. Dazu müssen wir eine Faltungsberechnung durchführen,
1.2 Beispiel für eine Faltungsoperation: Beispiel für die Kantenerkennung
Als einführendes Beispiel wird die Faltungsoperation verwendet, die die grundlegendste Komponente des Faltungs-Neuronalen Netzwerks darstellt.
1.2.1 Schritte der Kantenerkennung
Bei der Erkennung von Bildobjekten können wir vertikale Kanten im Bild erkennen.
Nehmen Sie ein 6×6-Graustufenbild auf. Da es sich um ein Graustufenbild handelt, handelt es sich um eine 6×6×1-Matrix.
Um vertikale Kanten in einem Bild zu erkennen, können Sie eine 3x3-Matrix (Filter/Kernel) erstellen. [ 1 0 − 1 1 0 − 1 1 0 − 1 ] beginne{bmatrix}1