Bonsai-8B-gguf:可用于在各类设备上实现低延迟文本生成,支持本地部署与高效推理。该项目是端到端1-bit语言模型,采用GGUF Q1_0_g128格式,体积仅1.15GB,较FP16小14.1倍,速度快6.2倍,跨平台支持CUDA、Metal和CPU。【此简介由AI生成】 - AtomGit AI社区