Ascend-SACT
/
Qwen3-30B-A3B-verl
like
0
添加到合集
强化学习
PyTorch
汉语
Apache License 2.0
NPU
hf_mirrors/BytedTsinghua-SIA/DAPO-Math-17k
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - Qwen3-30B-A3B-verl:基于昇腾A2机器和verl框架,实现Qwen3-30B-A3B模型的DAPO算法强化学习实践。依托DAPO-Math-17k数据集,提升数学推理能力,支持思维/非思维模式切换,原生32k上下文,昇腾NPU高效训练,开源可商用。【此简介由AI生成】 - AtomGit AI社区