gcw_C8PI9e90/deepfake-detector-model-v1-npu

deepfake-detector-model-v1-npu:可用于对人脸图像进行真假分类以检测深度伪造内容，核心功能包括单图推理、性能基准测试及 CPU 与 NPU 精度验证，亮点是基于 SigLIP2 架构在 Ascend NPU 上适配优化，推理速度快且精度高。【此简介由AI生成】 - AtomGit AI社区

Deepfake Detector Model v1 - NPU 适配

模型信息

原始模型：prithivMLmods/deepfake-detector-model-v1
架构：SiglipForImageClassification（基于 SigLIP2 微调）
参数数量：92,885,762
标签：{0: "Fake", 1: "Real"}
任务：二分类深度伪造图像分类

环境

组件	版本
PyTorch	2.9.0
torch_npu	2.9.0.post1
昇腾 CANN	8.5.1
NPU	昇腾 910B4（29.5GB）
Transformers	4.57.6

文件

文件	描述
`inference.py`	单图像推理 + 基准测试模式
`accuracy_run.py`	CPU 与 NPU 精度验证
`accuracy_run_perf.py`	NPU 性能基准测试
`result.json`	推理结果样例
`accuracy_report.json`	精度验证报告
`perf_report.json`	性能基准测试报告

使用方法

单图像推理

python3 inference.py \
  --model_path /path/to/deepfake-detector-model-v1 \
  --image /path/to/face_image.jpg \
  --output result.json

性能基准测试

python3 accuracy_run_perf.py /path/to/deepfake-detector-model-v1 10 perf_report.json

准确性验证

python3 accuracy_run.py \
  --model_path /path/to/deepfake-detector-model-v1 \
  --output accuracy_report.json

性能结果（Ascend 910B4）

指标	数值
平均延迟	11.16 ms
中位延迟	11.07 ms
P90 延迟	11.42 ms
P99 延迟	12.59 ms
最小延迟	10.88 ms
最大延迟	13.36 ms
吞吐量	89.59 img/s

精度结果

指标	数值
CPU 与 NPU 预测结果匹配	✅ 5/5
最大相对误差	0.0146%
平均相对误差	0.0077%
余弦相似度	1.0
状态	✅ PASS

精度结论：该模型已完成 Ascend NPU 适配部署，CPU 与 NPU 推理结果一致性验证通过，精度误差低于 1% 要求。

样本输出

{
  "predicted_class_id": 1,
  "predicted_label": "Real",
  "probabilities": [0.4700, 0.5300],
  "inference_time_ms": 16505.20
}

首次推理包含 JIT 编译开销（约 16 秒）。后续推理平均耗时约 11 毫秒。

精度结论

基于现有评测数据，CPU 与 NPU 的余弦相似度精度误差为 0.0%，小于 1% 的精度要求。

推理成功证据

本仓库提供完整的推理脚本，支持 CPU 和 NPU 双平台推理：

# NPU 推理
python3 inference.py --device npu

# CPU 推理
python3 inference.py --device cpu

推理完成后会输出推理结果和耗时，表明模型在 NPU 上推理成功。