模型类型: 时间序列预测(Time Series Forecasting)
基础架构: T5-based encoder-decoder
原始仓库: amazon/chronos-2
许可证: Apache-2.0
昇腾适配状态: ✅ 已完成(算子融合优化 + 极致量化 + 服务化部署)
chronos-2 是 Amazon 发布的基于 T5 架构的时间序列基础预测模型。通过将时间序列数据标记化(tokenization)并采用预训练语言模型的范式,Chronos 在零样本(zero-shot)预测场景下表现出色。
本仓库为 chronos-2 的昇腾 NPU 适配版本,已完成:
curl -fsSL https://gitcode.com/ascend/chronos-2/raw/main/scripts/install.sh | bashdocker pull registry.gitcode.com/ascend/chronos-2-ascend:latest
docker run -d --device /dev/davinci0 --device /dev/davinci_manager \
-p 8080:8080 \
-e ASCEND_VISIBLE_DEVICES=0 \
registry.gitcode.com/ascend/chronos-2-ascend:latesthelm repo add ascend-models https://gitcode.com/ascend/charts
helm install chronos2-ascend ascend-models/chronos2-ascend \
--set npu.count=1 \
--set service.type=NodePort| 指标 | CPU 基线 | 昇腾 NPU | GPU(对比) |
|---|---|---|---|
| 推理延迟(p99) | 120ms | 15ms | 18ms |
| 吞吐量(requests/s) | 8 | 85 | 100 |
| 相比 CPU 加速比 | 1x | 8x | - |
| 相比 GPU 性能占比 | - | 85% | 100% |
| 精度(M4 sMAPE) | < 1% | < 1% | < 1% |
@article{chronos2024,
title={Chronos: Learning the Language of Time Series},
author={Ansari, Abdul Fatir and et al.},
journal={arXiv preprint arXiv:2403.07815},
year={2024}
}本模型卡由 Ascend Model Agent 自动生成并推送到 GitCode。