a
ascend_model_docs
/
DeepSeek-V3-671B_A2-A3_Verl-GRPO
like
0
添加到合集
Apache License 2.0
NPU
arxiv:2409.19256
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
📭
暂无数据
讨论列表 - DeepSeek-V3-671B_A2-A3_Verl-GRPO:可在昇腾机器上完成 DeepSeek-V3-671B 模型的 GRPO 训练,支持 Megatron 后端与梯度 checkpointing,需 16 卡环境,提供环境准备、模型数据集下载及训练启动流程。【此简介由AI生成】 - AtomGit AI社区