たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

音響信号をどう表現するか

生波形か、変換した表現か

生波形の弱み

波形の違いがperceptualな違いに直結しない.
ゆえに波形の違いをlossに利用してもそれがperceptual lossの最小化に必ずしもならない (使うことはもちろんできるし、それで性能も出るときは出る)

特徴量の弱み

全変換する必要がある。
spectrogramなら位相も移す必要があり、Griffin-Limを使うか位相も機械学習で変換するか