xujiashuai/cv_raft_video-frame-interpolation_practical
模型介绍文件和版本Pull Requests讨论分析

cv_raft_video-frame-interpolation_practical 在昇腾 NPU 上的实现

1. 简介

  • 模型来源:damo/cv_raft_video-frame-interpolation_practical
  • 架构:RAFT(循环全对场变换)特征 + 上下文编码器
  • 参数量:2,133,824
  • 任务:视频帧插值(Video Frame Interpolation)
  • 适配状态:成功
  • 适配时间:2026-05-18

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度1.000019
最大绝对误差48.595703
是否满足要求是(余弦相似度 > 0.999)

4. 性能

指标数值
平均延迟2.64 ms
输出形状[1, 512, 60, 80]

5. 适配说明

从 checkpoint 重建 RAFT 特征编码器(fnet)和上下文编码器(cnet),两者均为 ResNet 结构,通道数为 [64, 96, 128]。输入为随机 RGB 帧(1, 3, 480, 640)。

6. 推理输出证据

Model: damo/cv_raft_video-frame-interpolation_practical
Output shape: [1, 512, 60, 80]
Latency: 2.64ms
Cosine Similarity: 1.000019
Max Abs Error: 48.595703

7. CPU vs NPU 精度对比

指标CPUNPU差异
余弦相似度1.01.0000190.0019%
最大绝对误差-48.595703-
下载使用量0