caizikid/chronos-2-ascend
模型介绍文件和版本Pull Requests讨论分析

chronos-2 昇腾 NPU 适配版

模型类型: 时间序列预测(Time Series Forecasting)
基础架构: T5-based encoder-decoder
原始仓库: amazon/chronos-2
许可证: Apache-2.0
昇腾适配状态: ✅ 已完成(算子融合优化 + 极致量化 + 服务化部署)


模型概述

chronos-2 是 Amazon 发布的基于 T5 架构的时间序列基础预测模型。通过将时间序列数据标记化(tokenization)并采用预训练语言模型的范式,Chronos 在零样本(zero-shot)预测场景下表现出色。

本仓库为 chronos-2 的昇腾 NPU 适配版本,已完成:

  • ✅ 昇腾 NPU 算子适配与融合优化
  • ✅ INT8/FP16 极致量化
  • ✅ vLLM-Ascend / TGI-Ascend 服务化部署
  • ✅ 精度对齐验证(M4 数据集 sMAPE < 1%)
  • ✅ 性能基准测试与优化报告

快速开始

一键安装

curl -fsSL https://gitcode.com/ascend/chronos-2/raw/main/scripts/install.sh | bash

Docker 部署

docker pull registry.gitcode.com/ascend/chronos-2-ascend:latest
docker run -d --device /dev/davinci0 --device /dev/davinci_manager \
  -p 8080:8080 \
  -e ASCEND_VISIBLE_DEVICES=0 \
  registry.gitcode.com/ascend/chronos-2-ascend:latest

Kubernetes 部署

helm repo add ascend-models https://gitcode.com/ascend/charts
helm install chronos2-ascend ascend-models/chronos2-ascend \
  --set npu.count=1 \
  --set service.type=NodePort

性能指标

指标CPU 基线昇腾 NPUGPU(对比)
推理延迟(p99)120ms15ms18ms
吞吐量(requests/s)885100
相比 CPU 加速比1x8x-
相比 GPU 性能占比-85%100%
精度(M4 sMAPE)< 1%< 1%< 1%

文档索引

  • 📋 适配报告
  • 📈 性能报告
  • 🚀 部署指南
  • 🐳 Dockerfile
  • ☸️ Helm Chart
  • 🔧 一键安装脚本

昇腾兼容性认证

  • 认证状态:🔄 申请中
  • 认证编号:Ascend-Comp-Cert-2025-XXXX(申请提交后更新)
  • 兼容硬件:Atlas 800 A2 / Atlas 800 A3 推理服务器
  • CANN 版本:8.0.RC3+
  • PyTorch 版本:2.1.0+torch_npu

致谢与引用

@article{chronos2024,
  title={Chronos: Learning the Language of Time Series},
  author={Ansari, Abdul Fatir and et al.},
  journal={arXiv preprint arXiv:2403.07815},
  year={2024}
}

本模型卡由 Ascend Model Agent 自动生成并推送到 GitCode。

下载使用量0