Deepfake-Detection-Exp-02-22-NPU

模型介绍

Deepfake-Detection-Exp-02-22 是一个基于 ViT (Vision Transformer) 的深度伪造图像检测模型（实验版本2）。该模型使用 Google 的 google/vit-base-patch32-224-in21k 作为基础架构（patch_size=32），在 Deepfake vs Real 数据集上微调，用于区分真实图像与深度伪造图像。

原始模型地址

ModelScope: https://www.modelscope.cn/models/prithivMLmods/Deepfake-Detection-Exp-02-22
HuggingFace: https://huggingface.co/prithivMLmods/Deepfake-Detection-Exp-02-22

任务类型

图像分类（Image Classification）- 二分类：Deepfake（深度伪造）vs Real（真实）

模型框架

PyTorch

输入格式

图像：RGB 格式，224x224 像素
预处理：resize 到 224x224，归一化（mean=0.5, std=0.5）

输出格式

logits：形状为 (batch_size, 2) 的张量
概率：经过 softmax 后的概率分布
类别：{0: "Deepfake", 1: "Real"}

依赖环境

Python 3.11+
PyTorch >= 2.0.0
torchvision >= 0.15.0
transformers >= 4.30.0
pillow >= 9.0.0
numpy >= 1.21.0

NPU 适配说明

该模型已适配华为昇腾 NPU（Ascend910）。主要适配工作：

使用 torch_npu 在昇腾 NPU 上运行模型推理
模型权重加载后通过 .to("npu") 迁移至 NPU 设备
输入张量同步迁移至 NPU
推理完成后释放 NPU 显存资源

环境准备

pip install torch torchvision transformers pillow numpy
python -c "import torch; print(torch.npu.is_available())"

推理命令

# CPU 推理
python inference.py --image path/to/image.jpg --device cpu

# NPU 推理
python inference.py --image path/to/image.jpg --device npu

推理结果

设备	类别	置信度	推理耗时
CPU	Real	0.501112	210.76 ms
NPU	Real	0.501014	11.12 ms

NPU 推理速度约为 CPU 的 19 倍。

CPU/NPU 精度测试方法

分别在 CPU 和 NPU 上对相同的测试图像运行推理
对比两边的 logits、概率分布和分类结果
使用分类一致性、概率差异、余弦相似度评估

python compare_cpu_npu.py

CPU/NPU 精度测试结果

测试图像	指标	CPU 结果	NPU 结果	差异
test_face.png	分类	Real	Real	一致
test_face.png	概率(Deepfake)	0.498888	0.498986	0.000098
test_face.png	概率(Real)	0.501112	0.501014	0.000098
test_face.png	余弦相似度	-	-	0.999989
test_face2.png	分类	Real	Real	一致
test_face2.png	概率(Deepfake)	0.489273	0.489225	0.000048
test_face2.png	概率(Real)	0.510727	0.510775	0.000048
test_face2.png	余弦相似度	-	-	0.999967

结论：NPU 与 CPU 推理结果误差 < 1%（最大概率相对误差 0.02%）

性能测试结果

设备	推理耗时 (ms)	加速比
CPU	210.76	1x
NPU (Ascend910)	11.12	~19x

精度结论

基于现有评测数据，CPU 与 NPU 的余弦相似度精度误差为 0.0011%，小于 1% 的精度要求。

推理成功证据

本仓库提供完整的推理脚本，支持 CPU 和 NPU 双平台推理：

# NPU 推理
python3 inference.py --device npu

# CPU 推理
python3 inference.py --device cpu

推理完成后会输出推理结果和耗时，表明模型在 NPU 上推理成功。

精度结论

基于现有评测数据，CPU 与 NPU 的余弦相似度精度误差为 0.0011%，小于 1% 的精度要求。

模型标签

#+NPU #+CV #+图像分类 #+深度伪造检测 #+ViT #+昇腾 #+PyTorch

模型介绍

设备

类别

置信度

推理耗时

CPU

Real

0.501112

210.76 ms

NPU

Real

0.501014

11.12 ms

CPU/NPU 精度测试结果

测试图像	指标	CPU 结果	NPU 结果	差异
test_face.png	分类	Real	Real	一致
test_face.png	概率(Deepfake)	0.498888	0.498986	0.000098
test_face.png	概率(Real)	0.501112	0.501014	0.000098
test_face.png	余弦相似度	-	-	0.999989
test_face2.png	分类	Real	Real	一致
test_face2.png	概率(Deepfake)	0.489273	0.489225	0.000048
test_face2.png	概率(Real)	0.510727	0.510775	0.000048
test_face2.png	余弦相似度	-	-	0.999967

结论：NPU 与 CPU 推理结果误差 < 1%（最大概率相对误差 0.02%）

设备

推理耗时 (ms)

加速比

CPU

210.76

NPU (Ascend910)

11.12

~19x

推理成功证据

本仓库提供完整的推理脚本，支持 CPU 和 NPU 双平台推理：

# NPU 推理
python3 inference.py --device npu

# CPU 推理
python3 inference.py --device cpu

推理完成后会输出推理结果和耗时，表明模型在 NPU 上推理成功。

精度结论

基于现有评测数据，CPU 与 NPU 的余弦相似度精度误差为 0.0011%，小于 1% 的精度要求。