第 4 コースの最初の週 畳み込みニューラル ネットワーク
2024-07-11
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
畳み込みニューラル ネットワークの第 4 コースの最初の週
1.1 コンピュータ ビジョンで遭遇する問題 (コンピュータ ビジョン)
コンピューター ビジョンを適用する際の 1 つの課題は、データ入力それは非常に大きくなる可能性があります。
- 64×64のスモールピクチャのデータサイズは64×64×3(3色チャンネル)となります。したがって、固有ベクトルは xxバツ寸法は 12288 です。
- 1000×1000 の画像の場合、特徴ベクトルの次元は 1000×1000×3 に達します。
- 最初の隠れ層に 1000 個の隠れユニットがあり、すべての重みが行列を形成するとします。 W [ 1 ] W^{[1]}わ[1] 。標準的な完全接続ネットワークにおけるこのマトリックスのサイズは 1000×300 万です。これを行うには、畳み込み計算を実行する必要があります。

1.2 畳み込み演算例:エッジ検出例
畳み込み演算は畳み込みニューラル ネットワークの最も基本的なコンポーネントです。エッジ検出は入門例として使用されます。

1.2.1 エッジ検出の手順
画像オブジェクトを検出する場合、画像内の垂直エッジを検出できます。

6×6 のグレースケール画像を撮影します。グレースケール画像なので6×6×1の行列ですが、
- 画像内の垂直エッジを検出するには、3x3 マトリックス (フィルター/カーネル) を構築できます。 [ 1 0 − 1 1 0 − 1 1 0 − 1 ] 始まり{bmatrix}1