たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

音響特徴量は、特徴を捉えているか

音響特徴量とは、生の音声波形を加工したものである。
加工前の音がもつ特徴を捉えた指標だと期待されている.
既知の音響特徴量に基づいた音声認識・合成・変換は、いまやデータに基づく特徴量を用いた、あるいはE2Eの方法に追いつかれつつある。
本当に、音響特徴量は本質を捉えた特徴量なのか?
皆さんの知見を分けて欲しい

学術的根拠

音響特徴量リスト

  • 基本周波数 / Fundamental frequency (F0)
  • スペクトル包絡 / spectral envelope
  • 非周期性指標 / aperiodicity
  • スペクトログラム
    • mel-スペクトログラム
  • ケプストラム

筆者について

神経科学専攻。
細胞生物学がバックグラウンド。
聴覚処理にはとても興味がある。