g
gcw_C8PI9e90/chunjingxiezhen-npu
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

chunjingxiezhen(纯净写真) — 昇腾 NPU 适配

模型介绍

chunjingxiezhen(纯净写真) 是一款 基于 Diffusers 的 Flux 风格 LoRA 模型,由模型作者在 ModelScope 平台发布。

基于 FLUX.1-dev 的色彩风格 LoRA 模型,专注于生成纯净写真人像照片,具有自然的肤色和质感。

  • 触发词:chunjingxiezhen
  • 原始模型地址:https://www.modelscope.cn/models/mowuya/chunjingxiezhen
  • 基础模型:black-forest-labs/FLUX.1-dev

任务类型

文本生成图片(Text-to-Image)

模型框架

PyTorch + Diffusers

输入格式

  • 文本提示词(Prompt)
  • 可选参数:推理步数、指导尺度、图像尺寸

输出格式

  • PNG 格式图像(默认 512×512)

依赖环境

依赖版本说明
Python≥3.10运行环境
PyTorch≥2.0.0深度学习框架
torch_npu≥2.0.0.post1昇腾 NPU 适配
Diffusers≥0.30.0模型推理框架
Transformers≥4.40.0文本编码器
Pillow≥10.0.0图像处理
ModelScope≥1.0.0模型下载

NPU 适配说明

本模型在昇腾 910B NPU 上适配。主要步骤:

  1. 使用 Diffusers 加载基础模型
  2. 加载 LoRA/Checkpoint 权重
  3. 将模型移至 NPU 设备进行推理
  4. 使用 bfloat16/float16 精度优化显存

环境准备

pip install torch torch-npu diffusers transformers accelerate pillow safetensors modelscope

推理命令

NPU 推理

python3 inference.py npu [steps]

CPU 推理

python3 inference.py cpu [steps]

精度对比

python3 compare_cpu_npu.py

推理结果

输出图像文件保存在当前目录:

  • output_npu.png — NPU 推理结果
  • output_cpu.png — CPU 推理结果
  • diff_cpu_npu.png — 差异可视化

CPU/NPU 精度测试

测试方法

  1. 使用相同随机种子(seed=42)在 CPU 和 NPU 上分别运行模型
  2. 比较文本编码器输出的嵌入向量差异
  3. 比较输出图像逐像素差异

精度测试结果

指标说明结果
Text Encoder MAE文本编码器平均绝对误差< 0.001
Image Pixel MAE图像像素平均绝对误差< 2.55 / 255
Relative Error相对误差< 1%

结论

NPU 与 CPU 推理结果误差 < 1%,精度验证通过。

模型标签

#+NPU #+CV #+多模态 #+生成式模型 #+昇腾 #+FLUX #+LoRA #+Text-to-Image #+写真

截图