2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Die Einstellungsschätzung wird mit Opencv+Mediapipe implementiert
Was ist Mediapipe?
Mediapipe ist ein Framework, das hauptsächlich zum Erstellen multimodaler Audio-, Video- oder Zeitreihendaten verwendet wird. Mit dem MediaPipe-Framework können beeindruckende ML-Pipelines erstellt werden, beispielsweise Inferenzmodelle wie TensorFlow, TFLite und Medienverarbeitungsfunktionen.
安装命令:
pip install mediapipe
Wenn es nicht installiert ist und installiert werden muss, führen Sie bitte diesen Befehl aus.
Die Einschätzung der menschlichen Pose anhand von Videos oder Live-Feeds spielt in verschiedenen Bereichen wie der Ganzkörper-Gestensteuerung, der quantifizierten körperlichen Betätigung und der Gebärdenspracherkennung eine entscheidende Rolle.
Es kann beispielsweise als Basismodell für Fitness-, Yoga- und Tanzanwendungen verwendet werden. Seine Hauptaufgabe findet es in der Augmented Reality.
Media Pipe Pose ist ein Framework für die hochauflösende Verfolgung menschlicher Posen, das Eingaben aus RGB-Videobildern übernimmt und 33 3D-Landmarken für den gesamten menschlichen Körper ableitet. Während aktuelle Methoden auf dem neuesten Stand der Technik hauptsächlich auf leistungsstarken Desktop-Umgebungen für die Inferenz basieren, übertrifft diese Methode andere Methoden und kann in Echtzeit sehr gute Ergebnisse erzielen.
Das Modell kann 33 Schlüsselpunkte vorhersagen, wie unten gezeigt:
Der spezifische Implementierungscode lautet wie folgt:
import cv2
import mediapipe as mp
import time