Als nächstes möchte ich Aufnahme und Schlüsselworterkennung in einem Programm integrieren.
Das erste, was einem bei der Ausführung von Sprachoperationen in Python in den Sinn kommt, ist PyAudio. Allerdings hatte ich ein kleines Problem bei der Installation von PyAudio auf der Platine. Es gibt kein vorgefertigtes Softwarepaket für dieses Board im Python-Warehouse. Das Softwarepaket muss auf dem Board kompiliert und generiert werden, und PortAudio wurde nicht auf das Board portiert, sodass PyAudio nicht verwendet werden kann Wir werden vorerst einen Weg finden, dieses Problem zu lösen. Die vorübergehende Methode, die ich übernommen habe, besteht darin, das zuvor erwähnte Shell-Skript zum Testen des Audios zu ändern, es eine Sekunde Sprache aufzeichnen zu lassen und dann das Python-Programm zur Schlüsselworterkennung aufzurufen. Wenn es JA ist, schalten Sie das LED-Licht bei der Entwicklung ein Wenn es NEIN ist, schalten Sie das LED-Licht auf dem Entwicklungsboard aus. Nach dem Ein- oder Ausschalten des Lichts wird eine entsprechende Aufforderung abgespielt. Um das Debuggen zu erleichtern, werden die Aufnahmeergebnisse nach der Aufnahme automatisch abgespielt, um festzustellen, ob die Aufnahme korrekt ist. INIT_FLAG="/home/root/shell/audio/.initialized_audio_device" PLAY_FILE="/home/root/shell/audio/short.mp3" RC_LOCAL_FILE="/etc/rc.local" DELETE_COMMAND="rm -f $INIT_FLAG" # 将开机自动删除音频初始化标志文件命令加入到开机自启中 if ! grep -qFx "$DELETE_COMMAND" "$RC_LOCAL_FILE"; then echo "$DELETE_COMMAND" >> "$RC_LOCAL_FILE" command -v "$1" > /dev/null 2>&1 amixer cset name='PCM Volume' 192 amixer cset name='Mono Mux' 'Stereo' amixer cset name='Playback De-emphasis' 2 amixer cset name='Capture Digital Volume' 192 amixer cset name='Capture Mute' 'on' amixer cset name='Capture Polarity' 'Normal' amixer cset name='3D Mode' 'No 3D' amixer cset name='ALC Capture Attack Time' 5 amixer cset name='ALC Capture Decay Time' 2 amixer cset name='ALC Capture Function' 'Stereo' amixer cset name='ALC Capture Hold Time' 2 amixer cset name='ALC Capture Max PGA' 3 amixer cset name='ALC Capture Min PGA' 6 amixer cset name='ALC Capture NG Switch' 'on' amixer cset name='ALC Capture NG Threshold' 9 amixer cset name='ALC Capture NG Type' 'Mute ADC Output' amixer cset name='ALC Capture Target Volume' 15 amixer cset name='ALC Capture ZC Switch' 'on' amixer cset name='Left Channel Capture Volume' 100% amixer cset name='Right Channel Capture Volume' 100% amixer cset name='Left Mixer Left Bypass Volume' 100% amixer cset name='Right Mixer Right Bypass Volume' 100% amixer cset name='Output 1 Playback Volume' 100% amixer cset name='Output 2 Playback Volume' 100% amixer cset name='ZC Timeout Switch' 'on' amixer cset name='Left PGA Mux' 'DifferentialL' amixer cset name='Right PGA Mux' 'DifferentialR' function init_board_mic() { check_command amixer && { amixer -q cset name='Differential Mux' 'Line 2' amixer -q cset name='Left Line Mux' 'Line 2L' amixer -q cset name='Right Line Mux' 'Line 2R' function init_headphone_mic() { check_command amixer && { amixer cset name='Differential Mux' 'Line 1' amixer cset name='Left Line Mux' 'Line 1L' amixer cset name='Right Line Mux' 'NC' check_command amixer && { amixer -q cset name='Left Mixer Left Bypass Switch' 'on' amixer -q cset name='Right Mixer Right Bypass Switch' 'on' amixer -q cset name='Left Mixer Left Playback Switch' 'off' amixer -q cset name='Right Mixer Right Playback Switch' 'off' check_command amixer && { amixer -q cset name='Left Mixer Left Bypass Switch' 'off' amixer -q cset name='Right Mixer Right Bypass Switch' 'off' amixer -q cset name='Left Mixer Left Playback Switch' 'on' amixer -q cset name='Right Mixer Right Playback Switch' 'on' check_command amixer && { amixer -q cset name='Left Mixer Left Bypass Switch' 'off' amixer -q cset name='Right Mixer Right Bypass Switch' 'off' amixer -q cset name='Left Mixer Left Playback Switch' 'off' amixer -q cset name='Right Mixer Right Playback Switch' 'off' amixer -q cset name='Left Line Mux' 'NC' amixer -q cset name='Right Line Mux' 'NC' function apply_config() { # read -r -p "请输入您的选择: " choice # if [[ "$choice" == "1" || "$choice" == "2" ]]; then printf "n应用麦克风配置项 %sn" "$choice" # 捕获Ctrl+C信号,并调用cleanup函数 # if ! check_initialized; then # printf "第一次运行,执行音频设备初始化...n" check_command arecord && arecord -f cd -d 1 -r 16000 "$RECORD_FILE" check_command aplay && aplay "$RECORD_FILE" output=$(python3 simple_audio.py --input=test.wav) if echo "$output" | grep -q ">>> YES"; then echo "Python程序输出YES,执行相应代码..." echo 1 > /sys/class/leds/sys-led/brightness echo heartbeat > /sys/class/leds/sys-led/trigger #gst-play-1.0 haodeyiweinindakai.mp3 aplay haodeyiweinindakai.wav elif echo "$output" | grep -q ">>> NO"; then echo "Python程序输出NO,执行其他代码..." echo none > /sys/class/leds/sys-led/trigger echo 0 > /sys/class/leds/sys-led/brightness #gst-play-1.0 haodeyiweininguanbi.mp3 aplay haodeyiweininguanbi.wav echo "Python程序输出未知结果,或者没有输出结果。" printf "n开始播音,按 Ctrl+C 可退出播音n" gst-play-1.0 --audiosink="alsasink" "$PLAY_FILE"
 Das vollständige Programm finden Sie im komprimierten Paket*Anhang: ja-nein-test.zip . Der Kernskriptcode lautet wie folgt: Dem folgenden Video nach zu urteilen, wird im Grunde der gewünschte Effekt erzielt. Ich hatte ursprünglich Bedenken, dass der Mikrofonaufnahmeeffekt des Boards die Erkennung beeinträchtigen würde, aber im Moment scheint es kein großes Problem zu sein. Da die Methode zunächst in einer Datei aufgezeichnet wird und die Zeit nur 1 Sekunde beträgt, ist die Verwendung recht umständlich. Manchmal ist die Aufnahme nicht vollständig, wenn Sie etwas langsam sprechen. Dies erfordert eine nachträgliche Optimierung der Sprachverarbeitung von Python.
[Testversion des Jiandian Atomic i.MX93 Development Board] Verwenden Sie Ihre Stimme, um JA oder NEIN zu sagen, um LED-Leuchten zu steuern
Darüber hinaus ist das derzeit verwendete Modell vorab trainiert, und chinesische Eingabeaufforderungswörter werden zur einfacheren Verwendung später trainiert. |