1.1 Problemas encontrados na visão computacional (Visão computacional)
Um desafio ao aplicar a visão computacional éentrada de dadosPode ser muito grande.
O tamanho dos dados de uma imagem pequena de 64×64 é 64×64×3 (3 canais de cores).Então nosso autovetor xxxA dimensão é 12288.
Para uma imagem de 1000×1000, a dimensão do vetor de características atinge 1000×1000×3.
Se houver 1.000 unidades ocultas na primeira camada oculta e todos os pesos formarem uma matriz E [ 1 ] E^{[1]}C[1] . O tamanho desta matriz em uma rede padrão totalmente conectada é de 1.000×3 milhões. Para fazer isso, precisamos realizar um cálculo de convolução,
1.2 Exemplo de operação de convolução: exemplo de detecção de borda
A operação de convolução é o componente mais básico da rede neural convolucional e é usada como exemplo introdutório.
1.2.1 Etapas de detecção de bordas
Ao detectar objetos de imagem, podemos detectar bordas verticais na imagem.
Obtenha uma imagem em tons de cinza 6×6. Por ser uma imagem em tons de cinza, é uma matriz 6×6×1,
Para detectar bordas verticais em uma imagem, você pode construir uma matriz 3x3 (filtro/kernel) [ 1 0 − 1 1 0 − 1 1 0 − 1 ] início{bmatriz}1