Z-Image 是 ⚡️- Image 系列的基础模型,专为高质量、强生成多样性、广泛的风格覆盖能力以及精准的提示词遵循而设计。 Z-Image-Turbo 以速度为核心, 而 Z-Image 则是一个完整容量、未经蒸馏的 Transformer 模型,旨在为需要最高级别创作自由度的创作者、研究人员和开发者提供坚实基础。
🌟核心特性
🆚 Z-Image 与 Z-Image-Turbo 对比
| 方面 | Z-Image | Z-Image-Turbo |
|---|---|---|
| CFG | ✅ | ❌ |
| 步数 | 50 | 9 |
| 可微调性 | ✅ | ❌ |
| 负面提示 | ✅ | ❌ |
| 多样性 | 高 | 低 |
| 视觉质量 | 高 | 极高 |
| 强化学习(RL) | ❌ | ✅ |
表 1 版本配套表
| 配套 | 版本 | 环境准备指导 |
|---|---|---|
| Python | 3.11.10 | - |
| torch | 2.8.0 | - |
推荐使用CANN 8.5.0版本(latest)以获取最优性能:CANN 8.5.0
# 需要以root用户执行如下命令
# 增加软件包可执行权限,以下以CANN 8.5.0,arm64架构,A2服务器910B芯片为例。
chmod +x ./Ascend-cann-toolkit_8.5.0_linux-aarch64.run
chmod +x ./Ascend-cann-910b-ops_8.5.0_linux-aarch64.run
# 校验软件包安装文件的一致性和完整性
./Ascend-cann-toolkit_8.5.0_linux-aarch64.run --check
./Ascend-cann-910b-ops_8.5.0_linux-aarch64.run --check
# 安装
./Ascend-cann-toolkit_8.5.0_linux-aarch64.run --install
./Ascend-cann-910b-ops_8.5.0_linux-aarch64.run --install
# 设置环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh下载软件包
wget https://download.pytorch.org/whl/cpu/torch-2.8.0%2Bcpu-cp311-cp311-manylinux_2_28_aarch64.whl安装命令
pip3 install torch-2.8.0+cpu-cp311-cp311-manylinux_2_28_aarch64.whl下载软件包
wget https://gitcode.com/Ascend/pytorch/releases/download/v7.2.0-pytorch2.8.0/torch_npu-2.8.0-cp311-cp311-manylinux_2_28_aarch64.whl安装命令
pip3 install torch_npu-2.8.0-cp311-cp311-manylinux_2_28_aarch64.whl执行以下命令可检查PyTorch框架和torch_npu插件是否已成功安装。
python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"输出如下类似信息说明安装成功。
tensor([[-0.6066, 6.3385, 0.0379, 3.3356],
[ 2.9243, 3.3134, -1.5465, 0.1916],
[-2.1807, 0.2008, -1.1431, 2.1523]], device='npu:0')# 若环境镜像中没有gcc、g++,请用户自行安装
yum install gcc
yum install g++
# 导入头文件路径
export CPLUS_INCLUDE_PATH=/usr/include/c++/12/:/usr/include/c++/12/aarch64-openEuler-linux/:$CPLUS_INCLUDE_PATHgit clone https://modelers.cn/MindIE/Z-Image.gitpip install git+https://github.com/huggingface/diffuserspip install -r requirements.txt修改权重配置文件:
vi ${model_path}/model_index.json做如下修改:
{
"_class_name": "ZImagePipeline",
"_diffusers_version": "0.36.0.dev0",
"scheduler": [
"diffusers",
"FlowMatchEulerDiscreteScheduler"
],
"text_encoder": [
"transformers",
"Qwen3Model"
],
"tokenizer": [
"transformers",
"Qwen2Tokenizer"
],
"transformer": [
"zimage",
"ZImageTransformer2DModel"
],
"vae": [
"diffusers",
"AutoencoderKL"
]
}export model_path="your local Z-Image model path"# 在环境中导入以下环境变量提高推理性能
export CPU_AFFINITY_CONF=2
export TASK_QUEUE_ENABLE=2
python inference.py \
--model_path ${model_path} \
--output_path "./output" \
--device_id 0 \
--prompt "两名年轻亚裔女性紧密站在一起,背景为朴素的灰色纹理墙面,可能是室内地毯地面。左侧女性留着长卷发,身穿藏青色毛衣,左袖有奶油色褶皱装饰,内搭白色立领衬衫,下身白色裤子;佩戴小巧金色耳钉,双臂交叉于背后。右侧女性留直肩长发,身穿奶油色卫衣,胸前印有“Tun the tables”字样,下方为“New ideas”,搭配白色裤子;佩戴银色小环耳环,双臂交叉于胸前。两人均面带微笑直视镜头。照片,自然光照明,柔和阴影,以藏青、奶油白为主的中性色调,休闲时尚摄影,中等景深,面部和上半身对焦清晰,姿态放松,表情友好,室内环境,地毯地面,纯色背景。" \
--negative_prompt "" \
--width 720 \
--height 1280 \
--infer_steps 50 \
--guidance_scale 4 \
--seed 42 参数说明:
Z-Image性能数据
| 硬件形态 | CPU规格 | NPU算力 | Batch Size | 分辨率 | 迭代次数 | 性能 | 采样器 | 备注 |
|---|---|---|---|---|---|---|---|---|
| Atlas 800I A2(8×64G) | 48核(arm) | 313T | 1 | 1024*1024 | 50 | 31.4s | FlowMatchEulerDiscreteScheduler | 单卡运行 |