たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

2021-10-23から1日間の記事一覧

DNNのCPU推論実装

BLAS: Intel MKL, OpenBLAS MKL-DNN PyTorch TorchScript libtorchから呼び出せるJIT-compiled モデル. 最初の20ループくらいで最適化が走るっぽい (ref). Fused-opsとかいろいろ. BLAS PyTorchは pip install時のCMakeでBLASライブラリを自動検出して利用. …