返回讨论列表

仅管理员可管理讨论分类。

讨论分类列表 - TinyLlama-1.1B-Chat-v1.0:可用于在 Ascend NPU 上部署轻量级对话模型,支持常识推理、代码生成等场景。项目记录 TinyLlama-1.1B-Chat-v1.0 在 NPU 的适配验证,单卡加载,吞吐量达 280-290 tokens/s,精度与 GPU 基线误差小。【此简介由AI生成】 - AtomGit AI社区