Qwen-7B-Chat-Int4是一个拥有70亿参数的对话模型,采用4位量化优化,专为在华为昇腾NPU基础设施上高效部署而设计。
完整部署说明请参见Qwen-7B-Chat-Int4-detailed.md。
# Clone this repository
git clone https://gitcode.com/weixin_72661020/Qwen-7B-Chat-Int4.git
# Navigate to the project directory
cd Qwen-7B-Chat-Int4
# Check out the detailed documentation
cat Qwen-7B-Chat-Int4-detailed.mdREADME.md - 本文件(项目概述)Qwen-7B-Chat-Int4-detailed.md - 完整部署指南SKILL.md - Claude 代码技能规范inference.py - 支持 NPU 的推理脚本evaluation.md - 测试结果与兼容性报告model_info.json - 模型规格说明本项目采用 Apache License 2.0 许可证 - 详情参见 LICENSE 文件。
查看配置参考:https://huggingface.co/docs/hub/spaces-config-reference