weixin_43499674
/
Qwen3-4B-Thinking-2507-FP8
like
0
添加到合集
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
📭
暂无数据
讨论列表 - Qwen3-4B-Thinking-2507-FP8:可用于在昇腾NPU上部署Qwen3-4B-Thinking-2507-FP8模型进行文本生成,通过补丁实现FP8权重反量化为BF16,支持Thinking模式、Prefix Caching等功能,单卡32GB显存即可运行。【此简介由AI生成】 - AtomGit AI社区