Google STT library: googleapis/nodejs-speech (npm@google-cloud/speech)
認証は環境変数
- types
$env:GOOGLE_APPLICATION_CREDENTIALS="path\to\credentials.json"
raw data & preprocessing
元データ: .m4a
GoogleSTT 用に.flac 化
切り方
原始的だけど、audacity のトラック分離出力を手動.
practical
Google S2Tでも日本語専門用語はこけまくって役に立たなかった.
音源をぶつ切りにしてリスクヘッジすることが必要.