ggg_0963
/
TinyLlama-1.1B-Chat-v1.0
like
0
添加到合集
汉语
Apache License 2.0
NPU
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
返回讨论列表
仅管理员可管理讨论分类。
讨论分类列表 - TinyLlama-1.1B-Chat-v1.0:可用于在 Ascend NPU 上部署轻量级对话模型,支持常识推理、代码生成等场景。项目记录 TinyLlama-1.1B-Chat-v1.0 在 NPU 的适配验证,单卡加载,吞吐量达 280-290 tokens/s,精度与 GPU 基线误差小。【此简介由AI生成】 - AtomGit AI社区