请问这里的量化是说每个输入通道一个scale吗？ #1

iamhankai · 2022-10-18T08:13:20Z

Line 191 in cc10d67

self.alpha = Parameter(torch.Tensor(in_features))

YanjingLi0202 · 2022-10-19T03:53:28Z

是的，我们是input channel-wise的方法。

iamhankai · 2022-10-19T08:01:26Z

那linear层怎么用int矩阵乘法做加速呢，是不是还要还原成fp32去做矩阵乘法？

YanjingLi0202 · 2022-10-25T10:33:54Z

linear层的加速应该跟conv层类似需要dequantize成fp32，具体实际部署需要使用部署框架。

Provide feedback