A primeira semana do quarto curso Rede Neural Convolucional

2024-07-11

A primeira semana do quarto curso Redes Neurais Convolucionais

Um desafio ao aplicar a visão computacional éentrada de dadosPode ser muito grande.

O tamanho dos dados de uma imagem pequena de 64×64 é 64×64×3 (3 canais de cores).Então nosso autovetor $x$ A dimensão é 12288.
Para uma imagem de 1000×1000, a dimensão do vetor de características atinge 1000×1000×3.
Se houver 1.000 unidades ocultas na primeira camada oculta e todos os pesos formarem uma matriz $E^{[1]}$ . O tamanho desta matriz em uma rede padrão totalmente conectada é de 1.000×3 milhões. Para fazer isso, precisamos realizar um cálculo de convolução,

Insira a descrição da imagem aqui

A operação de convolução é o componente mais básico da rede neural convolucional e é usada como exemplo introdutório.

Insira a descrição da imagem aqui

Ao detectar objetos de imagem, podemos detectar bordas verticais na imagem.
Insira a descrição da imagem aqui

Obtenha uma imagem em tons de cinza 6×6. Por ser uma imagem em tons de cinza, é uma matriz 6×6×1,

Para detectar bordas verticais em uma imagem, você pode construir uma matriz 3x3 (filtro/kernel)