たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

2021-01-01から1年間の記事一覧

DNN tips: Conv+FCをConvだけで表現

全結合をConvで表現できる. チャネルのこと深く考えなくて済むので楽. やり方: kernelサイズを最大、出力channel数を希望出力次元にするだけ 理由: 全面を覆ったらスライドも何も無くなり、単に要素にweight掛けてsumするだけになり、スカラ値が出てくる. ch…

音声合成器と特性: タスクごとに要件は違う

特性一覧 quality latency ↓ stream latency: サンプル出力時 - サンプル受信時 ↓ realtime factor; RTF: 処理時間/信号長 ↓ performance: リソース要求量/使用量 CPU/GPU/メモリ タスクと特性; 要件 音声素材検証 文章や補助入力を考えながら打って「よしこ…

仕様の軽視と見栄

意味を感じないのに納得したフリをして仕様化すると、後々仕様を無視するようになる. 仕様の無視はすなわち、客観的な詐欺である. https://www.mitsubishielectric.co.jp/news/2021/1001-b.html 公的な規格と整合しないことや顧客との契約で合意した仕様(顧…

BackwardとOptimizer

「誤差はいくつか」と「誤差をどう重みに反映するか」の役割分担. 特定の層だけ学習無しにしたい場合(例: Encoder-FixNet-Decoder)、誤差逆伝播をFixNetで止めるのはNG. なぜならEncoderへ誤差が伝わらないから. Backwardは通常通り計算して、OptimizerをE…

最適化時のNegativeLog処理

Negative: 最大化と最小化の逆転 Log: 単調性は守りつつ分数を差に変換 確率変数の場合、分配関数Zで割ってる場合が多い Zによる正規化で0に張り付くの防止

FairSeqのGSLMレポ解析

gslm/speech2unit: Speech-to-連続unit-to-離散unit. モデルと学習済みパラメータが配布. /pretrained: Speech-to-連続unitの部分 /cpc_feature_reader.py: PCP Speech-to-unitモデルの色々 CPCEncoder: [Conv-CN-ReLU]x5だけ. 超シンプル. CPCAR: ただのLST…

prediction in 機械学習

PredictionとReconstruction prediction: 対応する特徴量無しに対象の観測値を推定すること reconstruction: 対応する特徴量から対象の観測値を生成すること Predictionの場合、contextを基に観測値を推定する. イメージとしては、1枚だけ裏返しで他が全部表…

論文解説: Polyak (2021) Speech Resynthesis from Discrete Disentangled Self-Supervised Representations

ニューラルな音響特徴量(content, fo, speaker)からneural vocoderで音声合成/変換/圧縮できるかなチャレンジ. 表現学習とボコーダ学習は完全分離 (表現モデルをpretraining -> fix). fixされたモデル出力からボコーダ学習. content表現モデルはCPC, HuBER…

UX=クチコミ

AmazonのレビューみればどれもこれもUX. ユーザーが自分の体験を自分の目線で自分の言葉で書いてるんだから.

専門家・キャリア

feature専門家 technical専門家 の2パス 特定分野のUXをポンと渡されたら、実装スタックの候補をガーッと出せるのがfeature専門家 ある技術について、理論から実務、新規研究までできるのがtechnical専門家 組織構造で出てくるfunctional/featureと同じ構造 …

規模と構造

大規模スクラムや階層構造が詰むやつ. 現場の知見を重視して作られる良くある構造: 密なチーム→全チーム共通ヘッド→スケールしない 密なチーム→スケールしない→多チーム自律→feature単位の部分最適化 密なチーム→スケールしない→代議階層構造→チーム密にする…

意思決定の情報源

前提: 1エージェントが捌ける情報量には上限がある 世界でたった1人だけ正解を見出していて、それを拾いたい 「これが正解だ!」って100万人主張してたら、100万件を総当たり精査するしかない? たった1人しか正解を見出していないので、この段階で(精査なし…

アジャイルなやつ

私たちは、価値提供の実践 あるいは実践を手助けをする活動を通じて、 よりよい価値提供方法を見つけだそうとしている。 この活動を通して、私たちは以下の価値観に至った。 作業 (work) よりも価値 (value) を、 予測 (prediction) よりも適応 (adaption) …

マーケティング: 存在を製品に変える

人が絶滅してもリンゴは木になる. 人が絶滅してもiPhoneの在庫はそこにある. 人が絶滅してもビックサンダーマウンテンは走る. それが使われまいがなんだろうが、存在は存在として存在する. 存在は人が利用を認識することで製品/プロダクトと見做され、人に価…

価値提供仮説

「価値提供仮説」 value proposition hypothesis これをユーザーが価値あると感じてくれると思う (valueそのものの仮説) proposition過程 (needs/dissatisfaction-> UX -> value) UXを引き起こす提供方法/ソリューション 3つセットに対する仮説. 仮説は計画…

スクラムで気になってるところ

whatの適応は素晴らしい (そこらじゅうに埋め込まれたPBIリファイメントへの誘導) whyの適応は誘導が甘くない…? プロダクトゴールを定期的に見直すことは肝要なのに、それをencourageする仕組みが明示されてない. スタートアップの殆どは「価値のない問題」…

流れを誘導する

バイアスを掛ける インセンティブを働かせる 水は低きにながれる 水はひび割れを見つける encouragement 状態Xになって欲しいとして 「君が沢山やってるYはけしからん!禁止!」ってしても今度はZになって希望のXにはならない (c.f. ゲーム規制) 「状態Xにな…

プロセスアプローチの欠点

プロセスアプローチの背景信念: 良い system of processes があれば価値あるモノが出来る 反証: Garbage in, Garbage out 処理が優れていようが、出力は入力に依存する. 希望UXを入力に入れる優れたシステムがあるとして、ダメダメUXを希望したら (良くても)…

改善を望むなら目的を渡す

「この手順を厳守してください」「良い結果を出してください」 この状況で出来ることは手順実行の速度と精度をひたすら上げるだけ. 目的 <- 活動s 構造が認識された活動の型: 手順 直感的な活動もあれば、手順に従う活動もある. 型の認識は底上げ・理解・改…

OKRには評価可能なKeyResultが必須

マネジメント方法 「この作業やって」 「この成果実現して」 Aなら作業手順をやったか作業を確認すればいい Bだと方法を一任しているので、作業を見ただけではそれを評価できない (遊んでるのか成果だせる作業してるのかわからない. 遊んでるように成果だす…

権限と責任が不一致なときの反応

権限がないのに成果責任がある場合 死ぬほど確認する 「パターンθもあり得るんじゃないの?」「コスパとかいうけど、不明点が一切無くなるまでやるべきでしょ」「やるのは私なんですよ、納得するまで動きません」 権限がないので、一度受け入れたらそれで成…

問題と価値とユーザビリティ

価値のない問題 (もはや問題じゃない問題) を仮定するとユーザビリティはわかりやすい. 無でいられていない、という問題に対する最適解は、何もしないこと. 期待した成果が完全に、しかも超効率で得られるのでユーザビリティは非常に高い. ただ、無でいられ…

検証と仮定と妄想

マッチョモデル: 無作為に端から検証し採用 実務家モデル: 経験に基づき優先度を設定、上から検証し採用 ガリ勉モデル: 経験に基づき優先度を設定、上から無検証で採用 無限にリソースがあるからマッチョモデルで良いが、現実にはリソース制限があるので実務…

サービス指揮/ディレクション

サービスの指揮/ディレクション .1. 一貫した核心的UX .2. 持続的提供 (ロジスティクス) . . a. ビジネス . . b. dev を実現する施策の選定 サービス=ユーザーが一体と認識するシステムの範囲 なので施策はPR~マーケ~開発~運用まで全範囲 マーケ・テックリー…

UXの一貫性

一貫したUXを提供するために、core UXを定めてそこから全てを派生させる. Q. そもそもUXを一貫させる利点は? 一貫したUXの和というよりは積のような感覚もある. 一貫性のないUX / inconsistent UX 濁る、裏切られる 一貫性のない新機能 UX-A 10個、UX-B 新…

sys.float_info.minと配列代入の罠 - numpy float32

sys.float_info.min (とても小さい値) を代入しても何故か0.になる。logが死ぬ。 データ型を疎かにしてたらハマった. 再現コード float_array = numpy.array([1., 2.,], dtype=np.float32) tiny = sys.float_info.min print(float_array) # [1. 2.] float_ar…

librosaとscipyでFFTをマッチさせる

背景 librosaはSTFTがとっても便利。 プリミティブにFFTをしようと思ったらscipy.fft.rfftになる. この2つ、同じ動作するのだろうか? 動作 デフォルト動作だと違う動きをする. 以下が同じ動作をする librosa.stft(x_full, n_fft=n_fft, window="boxcar", ce…

離散信号のメル化が抱える難点

必ず周波数分解能が落ちる なんで? 離散の周波数成分1つは、それ以上分割できないquantumだから。 高周波成分の分解能を粗くすれば低周波を逆に精密に記述できる!…わけではない. 離散信号はもう周波数の離散化/量子化がなされてるので、post-hocに取り出せ…

ビット分割

n-bitの整数を整数の組み合わせで表現する方法. 上位ビット/下位ビットみたいなやつ. 表現 6bit == 26 == 0~63 これを上位3bitと下位3bitに分割し、そのペアで表現する. (3bit, 3bit) == (23, 23) == (0~8, 0~8) 変換法 上位decimal = valuedecial // 2nbit/…

Windows user-kernel I/O

Windowsにおいて、ユーザーモードとカーネルモード間でデータ転送を行う手法. Buffered I/O: user-mode Buffer, kernel-mode nonpaged Buffer, then an I/O manager transfers contents between buffers Direct I/O: user-mode Buffer, kernel-mode MDL whic…