本仓库包含经Nunchaku量化的Z-Image-Turbo版本,后者是一款高性能图像生成模型。本版本针对高效推理进行了优化,同时将性能损失控制在最小范围内。
暂无最新消息。敬请关注更新!
数据类型:适用于非Blackwell GPU(50系列之前)的INT4,适用于Blackwell GPU(50系列)的NVFP4。
秩(Rank):
r32:推理速度更快,r128:质量更佳,但推理速度较慢,r256:质量最高(推理速度最慢)。适用于一般用途的标准推理速度模型

@inproceedings{
li2024svdquant,
title={SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models},
author={Li*, Muyang and Lin*, Yujun and Zhang*, Zhekai and Cai, Tianle and Li, Xiuyu and Guo, Junxian and Xie, Enze and Meng, Chenlin and Zhu, Jun-Yan and Han, Song},
booktitle={The Thirteenth International Conference on Learning Representations},
year={2025}
}