cv_uhdm_image-demoireing - 昇腾 NPU 适配
1. 模型简介
UHDM 图像去摩尔纹模型,基于 ESDNet(Encoder-decoder with Semantic alignment and Dense fusion,即语义对齐与密集融合的编码器-解码器)架构,用于去除数字屏幕拍摄时产生的摩尔纹。
2. 昇腾 NPU 适配结果
| 指标 | 值 |
|---|
| Cosine Similarity | 1.000000 |
| Max Abs Error | 0.002218 |
| 平均延迟 | 23.90ms |
| 输出维度 | (1, 3, 64, 64) |
| 推理精度 | float32 |
| 设备 | Ascend 910B4 |
3. 环境要求
| 组件 | 版本 |
|---|
| CANN | 8.5.1 |
| torch_npu | 2.9.0.post1 |
| PyTorch | 2.9.0 |
| Python | 3.11 |
| modelscope | latest |
4. 快速使用
export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py
python evaluate.py
5. 推理输出证据
Model: iic/cv_uhdm_image-demoireing
Device: npu:0
Output shape: [1, 3, 64, 64]
Output sample: [-0.0885179415345192, 0.3886769711971283, -0.39146584272384644, -0.15365758538246155, -0.45795387029647827]
Latency: 23.90ms
--- CPU vs NPU 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.002218
SUCCESS
6. CPU 与 NPU 精度对比
| 指标 | CPU (float32) | NPU (float32) | 误差 |
|---|
| 余弦相似度 | 基准 | 1.000000 | 0 |
| 最大绝对误差 | - | 0.002218 | - |
| 输出维度 | (1, 3, 64, 64) | (1, 3, 64, 64) | 一致 |
7. 模型结构
- 骨干网络:ESDNet(带语义对齐的编码器-解码器)
- 编码器:含 RDB + SAM 模块的 3 级编码器
- 解码器:含 CSAF 融合的 3 级解码器
- 输入:RGB 图像(填充至 32 的倍数)
- 输出:多尺度恢复图像(3 个元素的元组)