たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

VRでカードはどうあるべきか

ドローできる -> 実体を持つ
実体を持つ -> 硬さは?
ペラペラだと自立さなさそう (空中に浮かない)
イラストゾーンはハリポタ型 (生きている、魂の格納)
カード破ったらどうなるん?
カード曲げたら?

カードは“魂の器”

厚みはありそう。
器がカードとして実体を持つイメージ。

剛体ってのはカードらしくない。
剛性をもつ薄い物体

材質は?
紙? -> 溶けそう
本物のカードって何でできているんだ?

数学の記号

機械学習分野で見かけたら

「∗」f ∗ g 畳み込み
アスタリスク - Wikipedia

ちなみにアスタリスクは5本足だったり6本足だったり8本足だったりする、やめてほしい。

「⊙」elementwise multiplication
circled dotと呼ばれる記号。
LSTMの文脈では上記の意味で使われる。
linear algebra - What does a dot in a circle mean? - Mathematics Stack Exchange
いわゆるアダマール積のことをいっている?

日本語声質変換 (ボイスチェンジ) の先駆者たち

アカデミアは一切フォローできていない。だれかフォローしてくださいお願いします。

おまけ

Voice Conversion Challenge 2018

Voice Conversion Challenge 2018 (VCC2018)

speaker conversion task.
+ parallel training - 4 source and 4 target speakers - Each speaker utters same sentences set consisting of around 80 sentences - voice conversion systems for all speaker-pair combinations + nonparallel training - other 4 source speakers - Each speaker utters another sentences set consisting of around 80 sentences - voice conversion systems for all speaker-pair combinations

音響特徴量は、特徴を捉えているか

音響特徴量とは、生の音声波形を加工したものである。
加工前の音がもつ特徴を捉えた指標だと期待されている.
既知の音響特徴量に基づいた音声認識・合成・変換は、いまやデータに基づく特徴量を用いた、あるいはE2Eの方法に追いつかれつつある。
本当に、音響特徴量は本質を捉えた特徴量なのか?
皆さんの知見を分けて欲しい

学術的根拠

音響特徴量リスト

  • 基本周波数 / Fundamental frequency (F0)
  • スペクトル包絡 / spectral envelope
  • 非周期性指標 / aperiodicity
  • スペクトログラム
    • mel-スペクトログラム
  • ケプストラム

筆者について

神経科学専攻。
細胞生物学がバックグラウンド。
聴覚処理にはとても興味がある。

最先端の結果は(論理的に)理解されえない、そのための伝える努力

高いレベルの結果を理解するには、高いレベルの知識が必須である。
しかし高いレベルの結果を出す人は、往々にしてとてもレベルの高い人である。
結果として、最先端の結果はあんまり伝わりきらない。そうならざるを得ない

だから、伝える努力が必要なのだ。
理解まではいかなくても、なんとなく分かるになってもらうための伝える努力.