合并请求 - Qwen3-30B-A3B-verl:基于昇腾A2机器和verl框架，实现Qwen3-30B-A3B模型的DAPO算法强化学习实践。依托DAPO-Math-17k数据集，提升数学推理能力，支持思维/非思维模式切换，原生32k上下文，昇腾NPU高效训练，开源可商用。【此简介由AI生成】

暂无数据

合并请求 - Qwen3-30B-A3B-verl:基于昇腾A2机器和verl框架，实现Qwen3-30B-A3B模型的DAPO算法强化学习实践。依托DAPO-Math-17k数据集，提升数学推理能力，支持思维/非思维模式切换，原生32k上下文，昇腾NPU高效训练，开源可商用。【此简介由AI生成】 - AtomGit AI社区