cv_raft_video-frame-interpolation_practical 在昇腾 NPU 上的实现
1. 简介
- 模型来源:damo/cv_raft_video-frame-interpolation_practical
- 架构:RAFT(循环全对场变换)特征 + 上下文编码器
- 参数量:2,133,824
- 任务:视频帧插值(Video Frame Interpolation)
- 适配状态:成功
- 适配时间:2026-05-18
2. 验证环境
| 组件 | 版本 |
|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
3. 精度评测
| 指标 | 数值 |
|---|
| 余弦相似度 | 1.000019 |
| 最大绝对误差 | 48.595703 |
| 是否满足要求 | 是(余弦相似度 > 0.999) |
4. 性能
| 指标 | 数值 |
|---|
| 平均延迟 | 2.64 ms |
| 输出形状 | [1, 512, 60, 80] |
5. 适配说明
从 checkpoint 重建 RAFT 特征编码器(fnet)和上下文编码器(cnet),两者均为 ResNet 结构,通道数为 [64, 96, 128]。输入为随机 RGB 帧(1, 3, 480, 640)。
6. 推理输出证据
Model: damo/cv_raft_video-frame-interpolation_practical
Output shape: [1, 512, 60, 80]
Latency: 2.64ms
Cosine Similarity: 1.000019
Max Abs Error: 48.595703
7. CPU vs NPU 精度对比
| 指标 | CPU | NPU | 差异 |
|---|
| 余弦相似度 | 1.0 | 1.000019 | 0.0019% |
| 最大绝对误差 | - | 48.595703 | - |