{0: "Fake", 1: "Real"}| 组件 | 版本 |
|---|---|
| PyTorch | 2.9.0 |
| torch_npu | 2.9.0.post1 |
| 昇腾 CANN | 8.5.1 |
| NPU | 昇腾 910B4(29.5GB) |
| Transformers | 4.57.6 |
| 文件 | 描述 |
|---|---|
inference.py | 单图像推理 + 基准测试模式 |
accuracy_run.py | CPU 与 NPU 精度验证 |
accuracy_run_perf.py | NPU 性能基准测试 |
result.json | 推理结果样例 |
accuracy_report.json | 精度验证报告 |
perf_report.json | 性能基准测试报告 |
python3 inference.py \
--model_path /path/to/deepfake-detector-model-v1 \
--image /path/to/face_image.jpg \
--output result.jsonpython3 accuracy_run_perf.py /path/to/deepfake-detector-model-v1 10 perf_report.jsonpython3 accuracy_run.py \
--model_path /path/to/deepfake-detector-model-v1 \
--output accuracy_report.json| 指标 | 数值 |
|---|---|
| 平均延迟 | 11.16 ms |
| 中位延迟 | 11.07 ms |
| P90 延迟 | 11.42 ms |
| P99 延迟 | 12.59 ms |
| 最小延迟 | 10.88 ms |
| 最大延迟 | 13.36 ms |
| 吞吐量 | 89.59 img/s |
| 指标 | 数值 |
|---|---|
| CPU 与 NPU 预测结果匹配 | ✅ 5/5 |
| 最大相对误差 | 0.0146% |
| 平均相对误差 | 0.0077% |
| 余弦相似度 | 1.0 |
| 状态 | ✅ PASS |
精度结论:该模型已完成 Ascend NPU 适配部署,CPU 与 NPU 推理结果一致性验证通过,精度误差低于 1% 要求。
{
"predicted_class_id": 1,
"predicted_label": "Real",
"probabilities": [0.4700, 0.5300],
"inference_time_ms": 16505.20
}首次推理包含 JIT 编译开销(约 16 秒)。后续推理平均耗时约 11 毫秒。
基于现有评测数据,CPU 与 NPU 的 余弦相似度 精度误差为 0.0%,小于 1% 的精度要求。
本仓库提供完整的推理脚本,支持 CPU 和 NPU 双平台推理:
# NPU 推理
python3 inference.py --device npu
# CPU 推理
python3 inference.py --device cpu推理完成后会输出推理结果和耗时,表明模型在 NPU 上推理成功。