ai-ascend-models/Qwen3-235B-A22B
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

0day首发!MindSpeed-LLM适配Qwen3并上线开源社区

Qwen3是阿里云于2025年4月28日发布并开源,作为 Qwen 系列中的最新一代大型语言模型,提供了一系列密集型和混合专家(MoE)模型。本次Qwen发布多个尺寸模型,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B。在Qwen-3正式发布的同一天,MindSpeed-LLM便立刻支持该模型的完美跑通,标志着MindSpeed-LLM在大规模语言模型应用和高效部署方面的技术优势再次得到巩固。

MindSpeed-LLM:为Qwen-3赋能,极速支持无缝集成

MindSpeed-LLM作为昇腾AI生态的重要技术支撑,专为大规模语言模型设计,具有超强的计算能力和灵活的开发支持。随着Qwen-3的发布,MindSpeed-LLM已立即做好了全面支持和优化准备,为开发者提供了一个稳定、高效的平台来快速部署和调优Qwen-3模型。

  • 硬件与框架深度协同,立刻跑通:MindSpeed-LLM与昇腾芯片的深度集成,使得Qwen-3大语言模型在发布的第一时间内,就能够顺利跑通并高效运行。无论是在训练过程中,还是在推理阶段,MindSpeed-LLM都为Qwen-3提供了最佳的硬件加速支持,确保性能的最大化释放。

  • 开箱即用,无需复杂配置:开发者只需简单配置,即可在MindSpeed-LLM上无缝运行Qwen-3模型。框架提供了完整的工具链,帮助开发者快速将Qwen-3应用到实际项目中,减少了复杂的调优过程,缩短了开发周期。

  • 分布式计算优化:MindSpeed-LLM内置的分布式计算能力,能够有效利用多台昇腾AI硬件,确保Qwen-3在大规模并发任务下的稳定运行,极大提升了处理效率和响应速度。

MindSpeed-LLM框架与Qwen-3的同步发布并立刻支持跑通,标志着昇腾平台在大语言模型领域的技术实力再次提升。开发者可以在第一时间内,借助强大的昇腾计算能力,快速将Qwen-3应用于实际项目,进一步加速智能应用的落地。

模型支持列表

模型名称功能Released
Qwen3OKDoing

MindSpeed跑通Qwen-3模型手把手教程:快速部署与应用

本教程将引导您完成从环境准备到模型训练的完整过程,确保您能够快速上手并顺利跑通Qwen-3模型。我们提供详细的步骤说明,帮助您在MindSpeed框架下实现Qwen-3模型的无缝运行。

目录

  • 环境配置
    • 硬件要求
    • MindSpeed-LLM仓库部署
  • 权重转换
  • 数据预处理
  • 模型训练
  • 推理
  • 评估

环境配置

硬件要求

qwen3的参考硬件配置如下,本文将以A2 单机8卡训练和推理为例进行介绍:

类型硬件配置
全参微调NPU8 x Ascend NPUs

MindSpeed-LLM仓库部署

MindSpeed-LLM的主要依赖配套如下表,安装步骤参考安装指导。

依赖软件版本
昇腾NPU驱动商发版本
昇腾NPU固件
CANN Toolkit(开发套件)商发版本
CANN Kernel(算子包)
CANN NNAL(Ascend Transformer Boost加速库)
Python>=3.10
PyTorch2.1.0
torch_npu插件2.1.0
apex商发版本

1. 仓库拉取

git clone https://gitcode.com/Ascend/MindSpeed-LLM.git
git clone https://github.com/NVIDIA/Megatron-LM.git
cd Megatron-LM
git checkout core_r0.8.0
cp -r megatron ../MindSpeed-LLM/
cd ..
cd MindSpeed-LLM
mkdir logs
mkdir dataset
mkdir ckpt

2. 环境搭建

torch npu 与 CANN包参考链接:安装包参考链接

# python3.10
conda create -n test python=3.10
conda activate test

# 安装 torch 和 torch_npu,注意要选择对应python版本、x86或arm的torch、torch_npu及apex包
pip install torch-2.1.0-cp310-cp310m-manylinux2014_aarch64.whl
pip install torch_npu-2.1.0*-cp310-cp310m-linux_aarch64.whl

# apex for Ascend 参考 https://gitcode.com/Ascend/apex
# 建议从原仓编译安装

# 安装加速库
git clone https://gitcode.com/Ascend/MindSpeed.git
cd MindSpeed
# checkout commit from MindSpeed core_r0.8.0
git checkout 2c085cc9
pip install -r requirements.txt
pip3 install -e .
cd ../MindSpeed-LLM


# 安装其余依赖库
pip install -r requirements.txt

注意 : 由于首发最新版本支持,要求transformers版本为4.51.3,用户需执行以下命令:

  pip install transformers == 4.51.3

数据预处理

MindSpeed-LLM提供脚本 进行数据集处理

使用方法如下,请根据实际需要修改以下参数

cd MindSpeed-LLM
bash tests/0day/qwen3/qwen3-30b-a3b/data_convert_qwen3_moe_pretrain.sh
参数名含义
--input数据集路径
--tokenizer-name-or-path模型tokenizer目录
--output-prefix数据集处理完的输出路径及前缀名

训练

cd MindSpeed-LLM
bash tests/0day/qwen3/qwen3-235b-a22b/pretrain_qwen3_235b_a22b_4k_A3_ptd.sh

用户需要根据实际情况修改脚本中以下变量

变量名含义
MASTER_ADDR多机情况下主节点IP
NODE_RANK多机下,各机对应节点序号
CKPT_SAVE_DIR训练中权重保存路径
DATA_PATH数据预处理后的数据路径
TOKENIZER_PATHqwen3 tokenizer目录
CKPT_LOAD_DIR权重转换保存的权重路径,为初始加载的权重,如无初始权重则随机初始化