TCFY7
/
SmolLM-135M-GQA-d_kv_128
like
0
添加到合集
PyTorch
Transformers
Safetensors
英文
Apache License 2.0
NPU
llama
text-generation
model-agent-tagged
arxiv:2502.14837
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
📭
暂无数据
讨论列表 - SmolLM-135M-GQA-d_kv_128:可用于在昇腾 NPU 上快速验证文本生成模型推理,该项目实现了 SmolLM-135M-GQA-d_kv_128 模型在 vLLM-Ascend 环境的零成本原生支持,具备高推理精度与良好性能。【此简介由AI生成】 - AtomGit AI社区