weixin_43499674/Wan2.1-Fun-V1.1-1.3B-Control-Camera-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Wan2.1-Fun-V1.1-1.3B-Control-Camera NPU 适配

模型简介

  • 模型名称: PAI/Wan2.1-Fun-V1.1-1.3B-Control-Camera
  • 任务类型: 相机控制视频生成 (Camera-Controlled Video Generation)
  • 基础架构: Wan2.1 + CameraCtrl Adapter
  • 适配平台: 华为昇腾 Ascend910 NPU
  • 源模型: https://www.modelscope.cn/models/PAI/Wan2.1-Fun-V1.1-1.3B-Control-Camera

功能

支持通过相机运动控制(平移、缩放等)生成视频,包括:

  • 向上摇摄/向下摇摄/向左摇摄/向右摇摄
  • 组合运动(如向上摇摄 + 向左摇摄)
  • 多分辨率支持(480p, 512p, 768p, 1024p)
  • 81帧视频生成,16fps

CPU vs NPU 精度比对

组件CPU(毫秒)NPU(毫秒)加速比相对误差余弦相似度状态
CameraAdapter_17f476.081.81263倍0.016%1.000241通过
CameraAdapter_41f1259.524.35290倍0.016%1.000769通过
CameraAdapter_81f2485.238.54291倍0.016%1.002159通过
CameraAdapter_512p1680.365.13327倍0.016%1.001368通过
ResidualBlock (小)2.000.1021倍0.004%1.000000通过
ResidualBlock (大)66.390.12541倍0.005%1.000039通过
Conv2d 3→160.960.0423倍0.015%1.000003通过
Conv2d 16→323.380.0572倍0.015%1.000010通过
Conv2d 32→6411.830.05253倍0.014%1.000023通过
QKV_Projection14.160.05296倍<0.001%1.000013通过
Out_Projection4.840.04115倍<0.001%1.000003通过
FFN_GELU38.230.09407倍0.020%1.000003通过
LayerNorm0.400.049倍<0.001%1.000008通过
PixelUnshuffle (小)25.550.4261倍0.000%1.000671通过
PixelUnshuffle (大)37.940.4781倍0.000%1.001017通过

总计: 15/15 通过。NPU 加速比 9倍-541倍,余弦相似度全部 > 0.999。

测试环境: Ascend910 NPU (61.3GB HBM) vs CPU。相同随机种子、相同权重、相同输入。wan_camera_npu_verification.json 包含每个测试的 MAE/MSE/RMSE 详细数据。

环境要求

  • NPU: 华为昇腾 Ascend910 (61.3GB HBM)
  • CANN: 8.5.1+
  • Python: 3.11
  • torch: 2.9.0
  • torch_npu: 2.9.0
  • 代码库: VideoX-Fun

使用方法

快速验证 NPU 适配

python3 wan_camera_npu_verify.py

使用预训练权重推理

# 下载模型权重 (~19GB)
modelscope download PAI/Wan2.1-Fun-V1.1-1.3B-Control-Camera

# 运行 NPU 推理
python3 wan_camera_npu_adapter.py

文件结构

├── README.md                       # 模型说明及YAML元数据
├── .gitcode.yml                    # 模型仓库配置
├── cpu_npu_comparison.py           # CPU vs NPU 精度比对脚本
├── cpu_npu_comparison.json         # CPU vs NPU 结构化比对数据
├── cpu_npu_comparison.txt          # CPU vs NPU 比对报告
├── wan_camera_npu_verify.py        # NPU适配验证脚本(独立运行)
├── wan_camera_npu_adapter.py       # 完整NPU推理适配器
├── wan_camera_npu_verification.json # 结构化验证结果
└── wan_camera_npu_verification.txt  # 文本验证报告

许可证

Apache 许可证 2.0