uksri/chronos-2
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

chronos-2 昇腾 NPU 适配验证报告

模型基本信息

属性值
模型名称chronos-2
模型家族Amazon Chronos
基础架构T5 (Encoder-Decoder)
任务类型时序预测 (Time-Series Forecasting)
说明chronos-2 是 Amazon 推出的 Chronos 时序预测模型系列之一,基于 T5 架构并搭配自定义时序预测头 (time-series head) 实现零样本时序预测能力。

昇腾适配状态

不支持 vLLM-Ascend 部署

经 verify-agent 完整验证流水线测试,chronos-2 无法通过 vLLM-Ascend 在昇腾 NPU 上部署为推理服务。

失败原因分析

验证过程中出现以下关键问题,导致部署失败:

  1. 模型 ID 不可达:chronos-2 并非标准的 HuggingFace namespace/name 格式,在 ModelScope 与 HuggingFace Hub 上均无法解析或定位对应仓库。
  2. 环境无外网连接:运行环境无外网访问能力,无法自动拉取远程权重;且本地缓存中不存在该模型文件。
  3. 架构不兼容:chronos 系列为时序预测专用模型(基于 T5 Encoder-Decoder + 自定义时序预测头),不属于 vLLM 支持的文本生成 (text-generation) 架构,vLLM 无法识别和调度其推理图。

建议

如需在昇腾 NPU 上运行 chronos-2 时序预测任务,请采用以下替代方案:

  • 原生 PyTorch + torch_npu 手动推理:绕过 vLLM 引擎,直接使用 torch_npu 加载模型权重并执行前向推理。需自行处理输入预处理(时间序列分词/嵌入)与输出后处理(预测结果解码)。
  • 模型格式转换:若原始权重为 PyTorch 格式,确保在昇腾环境下使用 torch_npu 进行设备映射(map_location="npu")。

验证环境

组件版本/型号
NPU910B4 (32 GB HBM)
CANN8.5.1
vLLM-Ascend0.18.0rc1
Triton-Ascend3.2.0.dev20260322
验证时间2026-05-08

验证日志摘要

[PASS] 环境预检:NPU 910B4 健康,vLLM-Ascend v0.18.0rc1 已安装
[FAIL] 模型部署(ModelScope):repo_id 格式错误,chronos-2 非 namespace/name 格式
[FAIL] 模型部署(HuggingFace):无法连接 Hub 且本地无缓存
[INFO] 资源清理:已终止残留 vLLM 进程
[INFO] 兼容性判定:chronos 系列为时序预测模型,与 vLLM 文本生成架构不兼容

本报告由昇腾模型适配验证工具 (verify-agent) 自动生成。