讨论分类列表 - TinyLlama-1.1B-Chat-v1.0:可用于在 Ascend NPU 上部署轻量级对话模型，支持常识推理、代码生成等场景。项目记录 TinyLlama-1.1B-Chat-v1.0 在 NPU 的适配验证，单卡加载，吞吐量达 280-290 tokens/s，精度与 GPU 基线误差小。【此简介由AI生成】

仅管理员可管理讨论分类。

讨论分类列表 - TinyLlama-1.1B-Chat-v1.0:可用于在 Ascend NPU 上部署轻量级对话模型，支持常识推理、代码生成等场景。项目记录 TinyLlama-1.1B-Chat-v1.0 在 NPU 的适配验证，单卡加载，吞吐量达 280-290 tokens/s，精度与 GPU 基线误差小。【此简介由AI生成】 - AtomGit AI社区