E
Eco-Tech/Kimi-K2.6-w4a8
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Kimi-K2.6-w4a8

1. 基本信息

项目信息
原始模型名Kimi-K2.6
原始模型链接 moonshotai/Kimi-K2.6
modelslim commit idb5190916a0f9a2a9b838508906e667891985356e
精度测试机型Atlas 800T A3 4台 2P1D
精度测试平台docker vllm-ascend
版本vllm-ascend:v0.18.0rc1
链接quay.m.daocloud.io/ascend/vllm-ascend:v0.18.0rc1

2 量化脚本:

Kimi-K2.6与K2.5结构相同,复用2.5量化方案:已集成量化方案

msmodelslim quant \
    --model_path ${model_path} \
    --save_path ${save_path} \
    --device npu \
    --model_type Kimi-K2.5 \
    --quant_type w4a8 \
    --trust_remote_code True

3 精度测试结果

模型名量化格式数据集测试精度 %官方精度 %
Kimi-K2.6-w4a8w4a8gpqa89.9090.5
  • 使用ais_bench,其中max_out_len = 98304,精度存在波动,建议多次测试。