本项目将 cubeai/brain_model 模型适配到昇腾 NPU (Ascend910B) 上运行。
| 项目 | 版本/信息 |
|---|---|
| NPU 驱动 | npu-smi 25.5.2 |
| NPU 设备 | Ascend910_9362 |
| Python | 3.11.14 |
| PyTorch | (环境自带) |
| torch_npu | (环境自带) |
| transformers | 4.50.0 |
NPU 健康状态: OK
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-4):
完整推理日志 (logs/inference.log):
=== cubeai/brain_model NPU Inference ===
Model: cubeai/brain_model
Loader type: transformers
Input shape: torch.Size([1, 3, 224, 224])
Output shape: torch.Size([1, 4])
Num classes: 4
NPU Top-4 Predictions:
Top-1: meningioma_tumor (0.420383)
Top-2: glioma_tumor (0.212789)
Top-3: no_tumor (0.203128)
Top-4: pituitary_tumor (0.163700)
All class probabilities:
glioma_tumor: 0.212789
meningioma_tumor: 0.420383
no_tumor: 0.203128
pituitary_tumor: 0.163700对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.001995 |
| mean_abs_error | 0.001702 |
| relative_error | 0.5102% |
| cosine_similarity | 0.999995 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg latency | 5.9918 ms |
| min latency | 5.9235 ms |
| max latency | 6.1166 ms |
| p50 latency | 5.9871 ms |
| p90 latency | 6.0660 ms |
| p95 latency | 6.0913 ms |
| images/sec | 166.89 |
测试配置: warmup 2 次 + 正式 10 次,单卡 NPU。
本项目包含单图 smoke consistency 验证,非官方完整验证集评测。详细指标见第 4 节。
见 screenshots/self_verification.png。
| 日志 | 说明 |
|---|---|
logs/inference.log | NPU 推理输出 |
logs/accuracy.log | CPU-NPU 精度一致性 |
logs/benchmark.log | NPU 性能基准测试 |
snapshot_download 下载,不提交到仓库。local_files_only=True 避免 HuggingFace 自动下载。#NPU #Ascend #Ascend910 #ViT #ImageClassification #BrainTumor