技術共有

第 4 コースの最初の週 畳み込みニューラル ネットワーク

2024-07-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

畳み込みニューラル ネットワークの第 4 コースの最初の週

1.1 コンピュータ ビジョンで遭遇する問題 (コンピュータ ビジョン)

コンピューター ビジョンを適用する際の 1 つの課題は、データ入力それは非常に大きくなる可能性があります。

  • 64×64のスモールピクチャのデータサイズは64×64×3(3色チャンネル)となります。したがって、固有ベクトルは xxバツ寸法は 12288 です。
  • 1000×1000 の画像の場合、特徴ベクトルの次元は 1000×1000×3 に達します。
  • 最初の隠れ層に 1000 個の隠れユニットがあり、すべての重みが行列を形成するとします。 W [ 1 ] W^{[1]}[1] 。標準的な完全接続ネットワークにおけるこのマトリックスのサイズは 1000×300 万です。これを行うには、畳み込み計算を実行する必要があります。

ここに画像の説明を挿入します

1.2 畳み込み演算例:エッジ検出例

畳み込み演算は畳み込みニューラル ネットワークの最も基本的なコンポーネントです。エッジ検出は入門例として使用されます。

ここに画像の説明を挿入します

1.2.1 エッジ検出の手順

画像オブジェクトを検出する場合、画像内の垂直エッジを検出できます。
ここに画像の説明を挿入します

6×6 のグレースケール画像を撮影します。グレースケール画像なので6×6×1の行列ですが、

  • 画像内の垂直エッジを検出するには、3x3 マトリックス (フィルター/カーネル) を構築できます。 [ 1 0 − 1 1 0 − 1 1 0 − 1 ] 始まり{bmatrix}1