ディレクトリ
基本的には~
がユーザープロファイルディクトリ。
PS> $env:USERPROFILE
で表示 (ref).
%USERPROFILE%
ってexplorerに打つとユーザープロファイルディレクトリへ飛べる
output: structured log1
{ container_id: "id", container_name: "name", source: "stdout" | "stderr", log: "containerLog", }
firelensで firelensConfiguration.options.enable-ecs-log-metadata = true
の場合
{ ...dockerStructureLog, ecs_cluster: "クラスター名", ecs_task_arn: "タスクARN", ecs_task_definition: "タスク定義名とリビジョン", }
structured container logをstdout/stderrに吐けばいい.
形式は要相談だけど、jsonにはする.
The only input plugin that don't assign Tags is Forward input.
This plugin speaks the Fluentd wire protocol called Forward where every Event already comes with a Tag associated.
Fluent Bit will always use the incoming Tag set by the client.
ref
敵の密集度に比例する.
3人が固まってたら威力3倍
必要視野角
良い手順 (プロセス) を開発して明示し、実行主体に依存しないシステムとする
ソフトウェアで実行してもよし、正社員で実行してもよし、バイトで実行してもよし。
実行主体のリソース限界からくる制限を小さくしやすいため、スケーリングが容易。安定性も高い。
目的を達成するために実行主体群の能力を最大限引き出せるワンオフ・オーダーメイドの組み合わせで回すシステム。
実行主体群の能力を最大限に引き出しているので、リソースの利用効率が最大。ゆえに実行主体群が超高額だったりしない限り、総合パフォーマンスは高い.
標準化すべき「上手く回るシステム」をそもそもどうやって作るのか。
標準化の過程は標準化できるのか。
簡単にオーダーメイドできたら苦労しない。天才軍師が必要。
CycleGAN + linear spectrogram + WareRNN Vocoder => similarity MOS 4.5, naturalness MOS 3後半
[わかる人向け記事]
Masaya Tanaka, Takashi Nose, Aoi Kanagaki, Ryohei Shimizu, and Akira Ito (2020) Scyclone: High-Quality and Parallel-Data-Free Voice Conversion Using Spectrogram and Cycle-Consistent Adversarial Networks.
linear-Spec conversion with CycleGAN + simplified-WaveRNN Vocoder
Similarity is super good (demo)
Better practically in WaveRNN-based vocoder
the low-dimensional linear spectrogram gives a better result than the mel spectrogram as the input of the following WaveRNN-based vocoder
G: (input) 160x1x128 => (channelx2) => 160x1x256 => (ResNetLoop) => 160x1x256 => (channel 1/2) => 160x1x128
D: (input) 160x1x128 => (head/tail cut) => 128x1x128 => (channelx2) => 128x1x256 => (ResNetLoop) => 128x1x256 => (channel 1) => 128x1x1 => (global average pooling) => 1
V: (input) 160x1x128 =>
8 frames (~64msec) => 8192 units => (reshape) => 128 sampling point * 64-dim vector
" More detailed description and evaluation of Scylone will be presented in our next article." from Scyclone paper
有用な情報が無
発表では女性間のみの評価ですが、男性→女性変換も問題なくできます。また、高速化したWaveRNNによりリアルタイム変換も一応動いているのでそのうちご紹介できればと。
tweet
from poster in tweet:
ノンパラレル声質変換手法Scyclone発表のポスターです。なお発表では女性間のみの評価ですが、男性→女性変換も問題なくできます。また、高速化したWaveRNNによりリアルタイム変換も一応動いているのでそのうちご紹介できればと。 https://t.co/cTzbpX7Pct pic.twitter.com/cpm2KFTsyv
— 能勢 隆 (Takashi Nose) (@takashi_nose) 2020年9月14日
totally enough except for chapter Ⅲ, which is roughly read (I will use other methods)
My reimplementation (now private)
preliminary: P100で2.37iter/sec(Google Colab Tesla P100-PCIE-16GB)。なので400K iterには46h.
CycleGAN-VC1とそこまで極端には変わらない感触(モデルサイズ的にも妥当だと思われ)
“we think that such high-level abstraction increases the risk of destroying linguistic information and the time structure of input speech.” from Scyclone paper↩
システム運用は多岐に渡る。その実装例@2020.
実装: Fluentd/bitの自動設定挿入