技術共有

Python OpenCV を使用した姿勢推定の実装--20240705

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

姿勢推定は Opencv+Mediapipe を使用して実装されています
メディアパイプとは何ですか?
Mediapipe は、主にマルチモーダル オーディオ、ビデオ、または任意の時系列データを構築するために使用されるフレームワークです。 MediaPipe フレームワークを使用すると、TensorFlow、TFLite などの推論モデル、メディア処理機能など​​の優れた ML パイプラインを構築できます。

安装命令:
pip install mediapipe
  • 1
  • 2

インストールされておらず、インストールする必要がある場合は、このコマンドを実行してください。

ビデオやライブフィードからの人間の姿勢推定は、全身ジェスチャー制御、定量化された身体運動、手話認識などのさまざまな分野で重要な役割を果たしています。

たとえば、フィットネス、ヨガ、ダンス アプリケーションのベース モデルとして使用できます。その主な役割は拡張現実にあります。

Media Pipe Pose は、RGB ビデオ フレームから入力を受け取り、人体全体の 33 の 3D ランドマークを推測する、忠実度の高い人間のポーズ追跡用のフレームワークです。現在の最先端の方法は主に推論のために強力なデスクトップ環境に依存していますが、この方法は他の方法よりも優れたパフォーマンスを発揮し、リアルタイムで非常に優れた結果を得ることができます。
このモデルは、以下に示すように 33 の重要なポイントを予測できます。
ここに画像の説明を挿入します
具体的な実装コードは以下のとおりです。

import cv2
import mediapipe as mp
import time
  • 1
  • 2