z-image-turbo-sda 是一个基于 LoKr (Low-Rank Kronecker Product) 适配器的图像生成模型,旨在恢复8步蒸馏模型中的生成多样性。
/data/ysws/agentsp/5-14/z-image-turbo-sda-ascend/
├── inference.py # 精度测试脚本
├── log.txt # 测试日志
├── README.md # 本文档
├── test_image_0.png # 测试图片样本
├── test_image_1.png
├── test_image_2.png
└── fusion_result.json # 融合结果docker exec -it test-modelagent bashsource /usr/local/Ascend/ascend-toolkit/set_env.sh模型文件应放在 /data/ysws/agentsp/5-14/z-image-turbo-sda/ 目录下:
pip install diffusers peft safetensors -i https://repo.huaweicloud.com/repository/pypi/simple/ --trusted-host repo.huaweicloud.comcd /data/ysws/agentsp/5-14/z-image-turbo-sda-ascend/
python3 inference.py| 指标 | 实测值 | 阈值 | 状态 |
|---|---|---|---|
| Max error (sum) | 4.17e-07 | < 1.00e+06 | PASS |
| Max error (mean) | 3.64e-12 | < 1.00e-04 | PASS |
| Max error (std) | 1.49e-08 | < 1.00e-03 | PASS |
| 操作 | 耗时 |
|---|---|
| 模型加载 | 0.04s |
| CPU 参考计算 (20 tensors) | 0.01s |
| NPU 张量读取 (20 tensors) | 2.01s |
完整测试日志保存在 log.txt
| 类型 | 说明 |
|---|---|
| *.alpha | 缩放因子 (标量) |
| *.lokr_w1 | LoKr 低秩分解 W1 |
| *.lokr_w2 | LoKr 低秩分解 W2 |
| 张量名称 | Sum Error | Mean Error | Std Error |
|---|---|---|---|
| diffusion_model.layers.0.adaLN_modulation.0.alpha | 0.00e+00 | 0.00e+00 | nan |
| diffusion_model.layers.0.adaLN_modulation.0.lokr_w1 | 0.00e+00 | 0.00e+00 | 0.00e+00 |
| diffusion_model.layers.0.adaLN_modulation.0.lokr_w2 | 0.00e+00 | 3.64e-12 | 0.00e+00 |
| diffusion_model.layers.0.attention.to_k.alpha | 0.00e+00 | 0.00e+00 | nan |
| diffusion_model.layers.0.attention.to_k.lokr_w1 | 0.00e+00 | 0.00e+00 | 1.49e-08 |
A: 检查 NPU 驱动是否正确安装,确保 CANN 环境变量已 source。
A: LoKr (Low-Rank Kronecker Product) 是一种参数高效的适配器结构,用于在不破坏原有模型的情况下注入新能力。