xujiashuai/cv_resnet_image-quality-assessment-mos_youtubeUGC
模型介绍文件和版本Pull Requests讨论分析

cv_resnet_image-quality-assessment-mos_youtubeUGC on Ascend NPU

1. 简介

本文档记录 damo/cv_resnet_image-quality-assessment-mos_youtubeUGC 在昇腾 NPU 上的适配验证结果。

  • 模型来源: damo/cv_resnet_image-quality-assessment-mos_youtubeUGC
  • 架构: ResNet18 backbone + 回归头 (Linear 512->1024->1)
  • 参数量: 11,702,849
  • 适配状态: SUCCESS
  • 适配时间: 2026-05-17

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
torchvision0.24.0
CANN8.5.1
  • NPU: Ascend 910B4
  • 系统: Ubuntu 22.04.5 LTS (aarch64)

3. 推理脚本

python inference.py --cache-dir ./models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --device npu:0

或使用 evaluate_iqa.py 进行完整验证:

python evaluate_iqa.py --cache-dir ./models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --output report.json

4. Smoke 验证

功能验证结果:

指标结果
输出形状[1, 1]
是否有 NaN否
推理状态正常

5. 性能参考

指标数值
平均延迟2.05 ms
峰值显存0.04 GB
测试轮数10

6. 精度评测

NPU vs CPU 精度对比

指标数值
Cosine Similarity1.000000
精度误差0.0000%
是否满足要求是(< 1%)

7. 评测材料

材料文件说明
推理脚本inference.py独立可运行的 NPU 推理代码
精度评测代码evaluate_iqa.pyCPU vs NPU cosine similarity 对比
环境检查env_check.pyNPU 环境验证脚本
运行日志logs/*.log完整执行日志(可复现)
精度报告report.json结构化评测数据
部署文档DEPLOY.md环境搭建与验证指南
依赖清单requirements.txtPython 依赖(uv/pip 安装)

8. Agent Skill

本模型适配由以下 Agent Skill 完成(6.2 必填)

项目内容
Skill 名称iqa-resnet-npu-adapt
触发条件ResNet 架构图像质量评估模型适配到昇腾 NPU
覆盖模型cv_resnet_image-quality-assessment-mos_youtubeUGC
核心能力torchvision ResNet 加载、权重重映射、NPU 迁移、FP16 推理、精度验证、性能基准

使用方法

Agent 自动执行:

# 1. 从 ModelScope 下载模型
python3 wave1/scripts/download_model.py --model damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --cache-dir ./models

# 2. 运行 NPU 评估
python3 wave1/1h_m2fp/evaluate_iqa.py --cache-dir ./models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --output report.json

手动复现步骤

# Step 1: 环境检查
python3 env_check.py

# Step 2: 验证模型
python3 evaluate_iqa.py --cache-dir ./models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --output report.json

# Step 3: 运行推理
python3 inference.py --cache-dir ./models/damo/cv_resnet_image-quality-assessment-mos_youtubeUGC --device npu:0

9. 模型说明

本模型为图像质量评估模型,基于 ResNet18 骨干网络 + 回归头,输出 MOS (Mean Opinion Score) 分数,范围 [0, 1],值越大代表图像质量越好。适用于 1080P 及以下分辨率的 UGC 图像质量评价。


贡献者: xujiashuai 参赛赛道: 模型适配赛道 提交时间: 2026-05-17

下载使用量0