讨论列表 - Kimi-K2--Thinking:在A+X环境下基于vLLM部署Kimi-K2-Thinking模型的实践案例。适配ubuntu 22.0、CANN 8.3.RC1及910B芯片,提供模型INT4→BF16反量化脚本,修改vllm-ascend代码解决KeyError,支持4节点64卡部署,附完整启动脚本与参数配置。【此简介由AI生成】 - AtomGit AI社区