たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

解説: OpenVINO Model Zoo WaveRNN(composite)

OpenVINO Model Zooにある wavernn (composite) というモデルの解説.

概要

mel2waveのWaveRNN Vocoder1.
fatchordタイプ、すなわちResNetベースのPreNetをもちMoLパラメータを出力する.
fatchordのLJSpeech学習済みモデル(ljspeech.wavernn.mol.800k.zip)をONNX形式で配布2,3.
wavernn_upsampler.onnxwavernn_rnn.onnx に分割されているのでcomposite4.

コード

ONNXの再現手順が書かれており、以下がソースとなるコード群.


  1. “WaveRNN performs waveform regression from mel-spectrogram.” from the model zoo

  2. “The model was trained on LJSpeech dataset” from the model zoo

  3. “We provide pre-trained models in ONNX format for user convenience.” from the model zoo

  4. “the model is divided into two parts: wavernn_upsampler.onnx, wavernn_rnn.onnx.” from the model zoo