From 61ec0379b7c38effdce10b19e12713648f6ced39 Mon Sep 17 00:00:00 2001 From: gushiqiao <77222802+gushiqiao@users.noreply.github.com> Date: Mon, 17 Feb 2025 13:15:44 +0800 Subject: [PATCH] Update README_zh.md --- README_zh.md | 3 +-- 1 file changed, 1 insertion(+), 2 deletions(-) diff --git a/README_zh.md b/README_zh.md index 0d48cb70..dd95c37e 100644 --- a/README_zh.md +++ b/README_zh.md @@ -48,8 +48,7 @@ docker pull registry.cn-hangzhou.aliyuncs.com/yongyang/llmcompression:pure-lates ## 最新消息 -- **2025年2月7日:** 🔥 我们现已全面支持 **`DeepSeekv3`**、**`DeepSeek-R1`** 和 **`DeepSeek-R1-zero`** 等 671B 大规模 **`MOE`** 模型的量化。 -现在,您可以直接加载 `FP8` 权重,无需额外转换。使用单张 80G 显存的 GPU 即可运行 `AWQ` 和 `RTN` 量化,同时还支持导出真实量化的 **INT4/INT8** 权重 +- **2025年2月7日:** 🔥 我们现已全面支持 **`DeepSeekv3`**、**`DeepSeek-R1`** 和 **`DeepSeek-R1-zero`** 等 671B 大规模 **`MOE`** 模型的量化。 现在,您可以直接加载 `FP8` 权重,无需额外转换。使用单张 80G 显存的 GPU 即可运行 `AWQ` 和 `RTN` 量化,同时还支持导出真实量化的 **INT4/INT8** 权重 - **2024年11月20日:** 🔥 我们现已全面支持✨`DeepSeekv2(2.5)`等`MOE`模型以及✨`Qwen2VL`、`Llama3.2`等`VLM`模型的量化。支持的量化方案包括✅整型量化、✅浮点量化,以及✅AWQ、✅GPTQ、✅SmoothQuant 和 ✅Quarot 等先进算法。