-
Boost Quantization Inference Performance
This artical summaries techniques utilized in convolution optimization for TVM. With AutoTVM empowered auto-tuning, carefully designed schedule algothrims and fine-grain computation manipulation may achieve impressive optimization results.
-
QNNPACK 实现揭秘
QNNPACK 是 Facebook 开发的专门用于量化神经网络计算的加速库,其卓越的性能表现一经开源就击败了几乎全部已公开的加速算法。
-
卷积神经网络优化算法
随着技术的发展,研究人员提出了多种卷积优化算法,包括 Im2col、Winograd 等等。本文简要介绍几种常见的优化方法,并讨论作者在该领域的一些经验。
-
通用矩阵乘(GEMM)优化算法
本文简要介绍通用矩阵乘(General Matrix Multiplication)优化的基本概念和方法、神经网络量化中的优化方法。旨在帮助大家在概念中建立一些直觉,无甚高论。