Skip to content

Commit

Permalink
Update README_ja.md
Browse files Browse the repository at this point in the history
  • Loading branch information
gushiqiao authored Feb 17, 2025
1 parent b284913 commit a8c3351
Showing 1 changed file with 1 addition and 2 deletions.
3 changes: 1 addition & 2 deletions README_ja.md
Original file line number Diff line number Diff line change
Expand Up @@ -48,8 +48,7 @@ docker pull registry.cn-hangzhou.aliyuncs.com/yongyang/llmcompression:pure-lates

## 最新情報

- V 🔥 私たちは現在、671Bパラメータを持つ大規模な **`MOE`** モデル、例えば **`DeepSeekv3`****`DeepSeek-R1`**、および **`DeepSeek-R1-zero`** の量子化を完全にサポートしています。
今すぐFP8ウェイトを追加の変換なしで直接読み込むことができます。AWQおよびRTN量子化は、1枚の80GB GPUで実行でき、さらに、真の量子化された **INT4/INT8** ウェイトのエクスポートにも対応しています。
- V 🔥 私たちは現在、671Bパラメータを持つ大規模な **`MOE`** モデル、例えば **`DeepSeekv3`****`DeepSeek-R1`**、および **`DeepSeek-R1-zero`** の量子化を完全にサポートしています。 今すぐFP8ウェイトを追加の変換なしで直接読み込むことができます。AWQおよびRTN量子化は、1枚の80GB GPUで実行でき、さらに、真の量子化された **INT4/INT8** ウェイトのエクスポートにも対応しています。

- **2024年11月20日:** 🔥 私たちは現在、✨`DeepSeekv2(2.5)`などの`MOE`モデルおよび✨`Qwen2VL``Llama3.2`などの`VLM`モデルの量子化を完全にサポートしています。対応する量子化手法には、✅整数量子化、✅浮動小数点量子化、さらに✅AWQ、✅GPTQ、✅SmoothQuant、✅Quarotといった高度なアルゴリズムが含まれます。

Expand Down

0 comments on commit a8c3351

Please sign in to comment.