たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

2020-12-21から1日間の記事一覧

Datasetの保存と圧縮

前提: CorpusとDatasetの分離 Datasetはそんなに長く持つものじゃない Corpusと違って公開するものでもない 何かあればCorpusからいつでも作り直せる 音声にzipで圧縮したら3割くらい減る 10GBのdatasetをzipで持って-3GB 転送量が減るメリットはある <= 日…