讨论列表 - internlm2_5-7b-chat-gguf:提供半精度及多种低比特量化版本,适配llama.cpp框架,支持本地与云端推理,含聊天、函数调用示例及OpenAI API兼容服务部署。【此简介由AI生成】 - AtomGit AI社区