2021-09-16から1日間の記事一覧

2021-09-16

論文解説: Polyak (2021) Speech Resynthesis from Discrete Disentangled Self-Supervised Representations

Audio AI 研究 paper

ニューラルな音響特徴量（content, fo, speaker）からneural vocoderで音声合成/変換/圧縮できるかなチャレンジ. 表現学習とボコーダ学習は完全分離 (表現モデルをpretraining -> fix). fixされたモデル出力からボコーダ学習. content表現モデルはCPC, HuBER…

たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

2021-09-16から1日間の記事一覧

論文解説: Polyak (2021) Speech Resynthesis from Discrete Disentangled Self-Supervised Representations