Skip to content

dlinfer release v0.1.1.post2

Compare
Choose a tag to compare
@jinminxi104 jinminxi104 released this 28 Oct 14:27
· 52 commits to main since this release
f59dd41

版本

v0.1.1.post2

更新内容

  1. 支持沐曦C500加速卡
  2. 支持华为图模式(llama3-8B/llama2-7B/Qwen2-7B)
  3. 华为支持W4A16量化与推理
  4. 其他华为与沐曦平台优化