1.1 Problemas encontrados en la visión por computadora (Visión por computadora)
Un desafío al aplicar la visión por computadora esentrada de datosPuede ser muy grande.
El tamaño de los datos de una imagen pequeña de 64×64 es 64×64×3 (3 canales de color).Entonces nuestro vector propio xxXLa dimensión es 12288.
Para una imagen de 1000 × 1000, la dimensión del vector de características alcanza 1000 × 1000 × 3.
Si hay 1000 unidades ocultas en la primera capa oculta y todos los pesos forman una matriz O [ 1 ] O^{[1]}Yo[1] . El tamaño de esta matriz en una red estándar totalmente conectada es de 1000×3 millones. Para hacer esto, necesitamos realizar un cálculo de convolución,
1.2 Ejemplo de operación de convolución: ejemplo de detección de bordes
La operación convolucional es el componente más básico de una red neuronal convolucional. La detección de bordes se utiliza como ejemplo introductorio.
1.2.1 Pasos de la detección de bordes
Al detectar objetos de la imagen, podemos detectar bordes verticales en la imagen.
Tome una imagen en escala de grises de 6×6. Debido a que es una imagen en escala de grises, es una matriz de 6×6×1,
Para detectar bordes verticales en una imagen, puede construir una matriz de 3x3 (filtro/núcleo) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] begin{bmatrix}1