q
qionner
/
Qwen3-4B-FP8-Ascend
like
0
添加到合集
文本生成
PyTorch
Transformers
Safetensors
Apache License 2.0
NPU
fp8
qwen3
model-agent-tagged
vllm
npu
ascend
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - Qwen3-4B-FP8-Ascend:用户可用于在昇腾NPU上部署Qwen3-4B-FP8模型进行文本生成。项目通过FP8反量化至BF16实现适配,精度损失<0.1%,支持单卡/多卡部署,提供推理及性能测试脚本。【此简介由AI生成】 - AtomGit AI社区