g
gcw_HxvH3o63/airealnet_ascend_model
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

Modotte/AIRealNet 昇腾 NPU 适配

1. 模型信息

  • 模型名称:Modotte/AIRealNet
  • 模型来源:Hugging Face / Transformers
  • 模型类型:图像二分类模型
  • 任务类型:AI 生成图像与真实图像判别
  • 输出类别数:2
  • 标签类别:artificial、real
  • 推理框架:PyTorch + Transformers + torch-npu
  • 运行设备:Ascend NPU
  • 适配目标:完成 Modotte/AIRealNet 模型在昇腾 NPU 环境下的图像分类推理验证,并与 CPU 推理结果进行误差对比。

本项目面向昇腾 Model-Agent 模型适配大赛赛道一,完成 Modotte/AIRealNet 图像二分类模型在 Ascend NPU 环境下的适配验证。项目基于 PyTorch、Transformers 和 torch-npu,完成模型下载、测试图片生成、CPU 推理、NPU 推理、分类输出、CPU/NPU 输出一致性对比以及验证材料整理。

2. 项目说明

Modotte/AIRealNet 是一个图像二分类模型,用于区分 AI-generated image 与 Real human image。本项目使用一张合成测试图片 test.jpg 作为输入,分别在 CPU 与 Ascend NPU 上执行推理,并比较两端输出 logits 与 probability 是否一致。

说明:test.jpg 是脚本生成的合成示意图,仅用于验证模型加载、图像预处理和前向推理流程,不用于评价模型在真实业务数据上的准确率。

本次适配重点包括:

  1. 在 Ascend NPU Notebook 环境中安装依赖;
  2. 从 Hugging Face 下载并加载 Modotte/AIRealNet 模型;
  3. 构造测试图片 test.jpg;
  4. 分别执行 CPU 与 NPU 图像分类推理;
  5. 保存 CPU/NPU 的 logits、probability 和 Top-K 分类结果;
  6. 对 CPU 与 NPU 输出进行误差对比;
  7. 保存日志、截图和适配报告,用于赛道一模型适配验证提交。

3. 工程结构

.
├── README.md
├── adaptation_report.md
├── download_model.sh
├── make_test_image.py
├── inference.py
├── compare_cpu_npu.py
├── build_readme.py
├── requirements.txt
├── test.jpg
├── cpu_result.json
├── cpu_result.txt
├── npu_result.json
├── npu_result.txt
├── compare_result.txt
├── fusion_result.json
├── run.log
└── screenshots/
    ├── npu_env.png
    ├── npu_result.png
    └── compare_result.png

其中:

  • download_model.sh:模型下载脚本;
  • make_test_image.py:测试图片生成脚本;
  • inference.py:CPU/NPU 推理脚本;
  • compare_cpu_npu.py:CPU/NPU 输出误差对比脚本;
  • build_readme.py:README 自动生成脚本;
  • cpu_result.json:CPU 推理结构化结果;
  • cpu_result.txt:CPU 推理日志;
  • npu_result.json:NPU 推理结构化结果;
  • npu_result.txt:NPU 推理日志;
  • compare_result.txt:CPU/NPU 误差对比结果;
  • fusion_result.json:结构化对比结果;
  • run.log:完整运行日志;
  • screenshots/:验证截图材料。

4. 环境检查

在 Ascend NPU Notebook 中执行以下命令检查运行环境:

npu-smi info
python --version
python - <<'PY'
import torch
print("torch:", torch.__version__)

try:
    import torch_npu
    print("torch_npu import success")
    print("npu available:", torch.npu.is_available())
except Exception as e:
    print("torch_npu import failed:", repr(e))
PY

环境检查截图保存为:

screenshots/npu_env.png

该截图用于证明当前运行环境存在 Ascend NPU,并记录 NPU 型号、运行状态和 Python 版本信息。

5. 模型下载

运行:

bash download_model.sh

模型来源为:

Modotte/AIRealNet

模型文件默认下载到:

./model

本次本地模型目录中包含:

model/config.json
model/model.safetensors
model/preprocessor_config.json
model/README.md

说明模型配置、预处理配置和权重文件已经下载成功。

6. 测试输入

生成测试图片:

python make_test_image.py

生成文件:

test.jpg

推理流程包括:

  1. 读取测试图片;
  2. 使用 Transformers 图像处理器进行预处理;
  3. 构造输入张量 pixel_values;
  4. 输入 Modotte/AIRealNet 图像二分类模型;
  5. 输出 2 维分类 logits;
  6. 计算 softmax probability;
  7. 输出 Top-K 分类结果。

本次输入张量形状为:

pixel_values: [1, 3, 256, 256]

7. CPU 推理

运行:

python inference.py --device cpu --model ./model --image test.jpg --output cpu_result.json 2>&1 | tee cpu_result.txt

CPU 推理输出文件:

cpu_result.json
cpu_result.txt

CPU 推理日志摘要如下:

Loading model: ./model
Model ID: Modotte/AIRealNet
Using device: cpu
Python: 3.11.14
torch: 2.9.0+cpu
transformers: 4.57.6
Input image: test.jpg
pixel_values shape: [1, 3, 256, 256] device: cpu
output_shape: [1, 2]

CPU Top-K 输出如下:

rank 1: label_id=1, label=real, logit=1.57633865, probability=0.93286514
rank 2: label_id=0, label=artificial, logit=-1.05521846, probability=0.06713487

8. NPU 推理

运行:

python inference.py --device npu --model ./model --image test.jpg --output npu_result.json 2>&1 | tee npu_result.txt

NPU 推理输出文件:

npu_result.json
npu_result.txt

NPU 推理日志摘要如下:

Loading model: ./model
Model ID: Modotte/AIRealNet
Using device: npu:0
Python: 3.11.14
torch: 2.9.0+cpu
transformers: 4.57.6
Input image: test.jpg
pixel_values shape: [1, 3, 256, 256] device: npu:0
output_shape: [1, 2]

NPU Top-K 输出如下:

rank 1: label_id=1, label=real, logit=1.57589209, probability=0.93280596
rank 2: label_id=0, label=artificial, logit=-1.05472064, probability=0.06719402

NPU 推理结果截图保存为:

screenshots/npu_result.png

日志中出现的 CANN owner warning 和:

path string is NULLpath string is NULL

属于 torch-npu / CANN 环境提示信息,不影响模型加载、NPU 推理和结果保存。本次验证已经成功获得 NPU 分类输出。

9. CPU/NPU 误差对比

运行:

python compare_cpu_npu.py --cpu cpu_result.json --npu npu_result.json --output_json fusion_result.json 2>&1 | tee compare_result.txt

对比脚本会读取 CPU 与 NPU 的 logits 和 probability 输出,并计算:

  • CPU/NPU 输出形状;
  • CPU Top-K;
  • NPU Top-K;
  • CPU/NPU Top-1 是否一致;
  • CPU/NPU Top-K 顺序是否一致;
  • Top-K 重合数量;
  • logits 最大绝对误差;
  • logits 平均绝对误差;
  • logits RMSE;
  • logits 最大相对误差;
  • logits 平均相对误差;
  • logits 余弦相似度;
  • probability 最大绝对误差;
  • probability 平均绝对误差;
  • probability 最大相对误差;
  • probability 平均相对误差;
  • probability 余弦相似度;
  • 是否通过验证。

对比结果保存为:

compare_result.txt

10. 自验证结果

本次 Modotte/AIRealNet 适配验证的 CPU/NPU 误差结果如下:

指标结果
CPU 输出形状(2,)
NPU 输出形状(2,)
CPU Top-K[1, 0]
NPU Top-K[1, 0]
CPU Top-1real
NPU Top-1real
CPU/NPU Top-1 是否一致True
CPU/NPU Top-K 顺序是否一致True
Top-K 重合数量2/2
logits 最大绝对误差0.0004978180
logits 平均绝对误差0.0004721880
logits RMSE0.0004728831
logits 最大相对误差0.0004717673
logits 平均相对误差0.0003775276
logits 余弦相似度1.0000000663
probability 最大绝对误差0.0000591874
probability 平均绝对误差0.0000591688
probability 最大相对误差0.0008810515
probability 平均相对误差0.0004722492
probability 余弦相似度0.9999999319
是否通过验证True

对应的 compare_result.txt 内容如下:

CPU/NPU comparison result
==================================================
model: Modotte/AIRealNet
cpu_result: cpu_result.json
npu_result: npu_result.json

cpu_output_shape: (2,)
npu_output_shape: (2,)

cpu_topk: [1, 0]
npu_topk: [1, 0]
same_top1: True
same_topk_order: True
topk_overlap: 2/2

logit_max_abs: 0.0004978180
logit_mean_abs: 0.0004721880
logit_rmse: 0.0004728831
logit_max_rel: 0.0004717673
logit_mean_rel: 0.0003775276
logit_cosine_similarity: 1.0000000663
probability_max_abs: 0.0000591874
probability_mean_abs: 0.0000591688
probability_max_rel: 0.0008810515
probability_mean_rel: 0.0004722492
probability_cosine_similarity: 0.9999999319

passed: True

根据上述结果,CPU 与 NPU 的 Top-1 结果均为 real,Top-K 顺序完全一致,Top-K 重合数量为 2/2。logits 最大绝对误差为 0.0004978180,probability 最大绝对误差为 0.0000591874,probability 余弦相似度达到 0.9999999319,验证结果为 passed: True。因此,本次 Modotte/AIRealNet 昇腾 NPU 推理验证通过。

11. 验证截图材料

11.1 NPU 环境截图

npu_env

该截图展示 Ascend NPU Notebook 环境、npu-smi info 输出和 Python 版本信息。

11.2 NPU 推理结果截图

npu_result

该截图展示 NPU 推理日志,包括模型名称、运行设备、输入图片、输入张量形状、输出张量形状和 Top-K 分类结果。

11.3 CPU/NPU 误差对比截图

compare_result

该截图展示 CPU/NPU 输出误差对比结果,包括 Top-K 一致性、logits 误差、probability 误差和余弦相似度。

12. 运行日志与提交材料

本项目提交材料包括:

  • README.md
  • adaptation_report.md
  • download_model.sh
  • make_test_image.py
  • inference.py
  • compare_cpu_npu.py
  • build_readme.py
  • requirements.txt
  • test.jpg
  • cpu_result.json
  • cpu_result.txt
  • npu_result.json
  • npu_result.txt
  • compare_result.txt
  • fusion_result.json
  • run.log
  • screenshots/npu_env.png
  • screenshots/npu_result.png
  • screenshots/compare_result.png

完整运行日志可查看:

run.log

CPU 推理日志可查看:

cpu_result.txt

NPU 推理日志可查看:

npu_result.txt

CPU/NPU 误差对比结果可查看:

compare_result.txt

13. 适配说明

本项目的适配工作包括:

  1. 在 Ascend NPU 环境中完成依赖安装;
  2. 编写 Hugging Face 模型下载脚本;
  3. 使用 Transformers 加载 Modotte/AIRealNet 模型;
  4. 编写测试图片生成脚本;
  5. 编写 CPU/NPU 统一推理脚本;
  6. 支持测试图片输入和 Transformers 图像预处理;
  7. 保存 CPU 与 NPU 的结构化分类结果;
  8. 编写 CPU/NPU logits 与 probability 误差对比脚本;
  9. 计算 Top-1 一致性、Top-K 顺序一致性、最大绝对误差、平均绝对误差、RMSE、相对误差和余弦相似度;
  10. 输出完整日志、截图和适配报告。

14. 结论

本项目完成了 Modotte/AIRealNet 模型在 Ascend NPU 环境下的图像分类推理适配验证。

验证结果表明,NPU 推理能够正常完成模型加载、图像预处理和图像二分类输出。CPU 与 NPU 的 Top-1 结果均为 real,Top-K 顺序完全一致,logits 最大绝对误差为 0.0004978180,probability 最大绝对误差为 0.0000591874,probability 余弦相似度达到 0.9999999319,并通过验证。本项目可作为赛道一模型适配提交材料。