たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

prediction in 機械学習

PredictionとReconstruction

  • prediction: 対応する特徴量無しに対象の観測値を推定すること
  • reconstruction: 対応する特徴量から対象の観測値を生成すること

Predictionの場合、contextを基に観測値を推定する.
イメージとしては、1枚だけ裏返しで他が全部表の神経衰弱

Reconstructionは特徴量/潜在表現があって、それをfullの観測値へと変換する.
イメージとしては、「ハートのK」という文字列表現をカード画像へと再構成する.

データを欠損させて欠損推定をするか、データを圧縮して再構成するかなので、どっちもUnsupervisedに学習できる.

Predictionの例

Masked Language Model (e.g. BERT)

"'masked language model' (MLM) pre-training objective, inspired by the Cloze task (Taylor, 1953)."
BERT paper. arxiv 1810.04805

超解像度とか画像生成の文脈でマスク画像からのフル画像再構成が出てくるけど、あれは多分にPredictionをしている.

Word2Vec
prediction target: neighbor words