Ascend Tribe/openPangu-2.0-Flash
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

openPangu-2.0-Flash

中文 | English

1. 简介

openPangu-2.0-Flash 是基于昇腾 NPU 训练的大规模混合专家(MoE)语言模型,参数规模约 92B,每 token 激活参数规模约 6B,模型支持 512k 上下文长度,训练数据总量约34T tokens。后训练阶段完成快慢合一微调(SFT)、多专项强化学习(RL),并通过在线蒸馏(OPD)完成能力合一。

2. 模型架构

openPangu-2.0-Flash 在模型架构上实现了全面的升级:

  • Attention架构:沿用高效 MLA,并采用 DSA+SWA 独立分层混合架构,层配比为 1:2;SWA 层负责局部窗口建模,DSA 层负责稀疏全局聚合,在保持精度的同时显著降低长序列推理的计算、显存与访存开销。
  • 拓扑架构:将传统残差连接升级为 4 支流 mHC 架构,提升表征多样性与泛化能力。
  • 自投机模块:采用 3 头 MTP 架构,一次额外预测 3 个 token,显著提升模型的推理速度。
  • Muon优化器:训练中采用Muon优化器,获得更快的收敛速度。

3. 测评结果

测评集测评指标openPangu-2.0-Flash-ThinkingopenPangu-2.0-Flash-Non-Thinking
通用能力
CL-BenchAcc20.415.5
IFEvalPrompt Strict95.989.3
IFBenchPrompt Strict79.654.4
AgentIF(CSR+ISR)/244.943.9
SysBenchISR91.187.9
MultichallengeAcc68.451.9
推理能力
AIME 2026Avg@1693.386.5
 - w/ PythonAvg@1698.1-
HMMT Feb 2025Avg@1691.567.1
 - w/ PythonAvg@1696.9-
IMO-AnswerBenchAcc76.562.3
 - w/ PythonAcc80.8-
BBEHHarmonic Mean62.551.5
GPQA-DiamondAvg@483.779.8
Agent能力
BrowseCompAcc57.0-
SkillsBenchAvg@542.640.0
PinchBenchAvg@385.682.5
Claw-EvalPass^357.758.2
WildClawBenchAvg@341.535.0
MCP-AtlasAcc58.947.9
TAU2-BenchAvg@388.074.0
代码能力
LiveCodeBench V6Avg@385.150.9
DeepCodeBenchAvg@376.570.9
SWE-bench VerifiedAvg@363.157.6
FeatBenchAvg@345.945.8

4. 部署和使用

  • 使用omni-infer推理框架,部署方式参考[openPangu-2.0-Flash部署说明]
  • 源码仓:[openPangu-2.0-Infer]

5. 模型许可证

除文件中对开源许可证另有约定外,openPangu-2.0-Flash 模型根据 OPENPANGU MODEL LICENSE AGREEMENT VERSION 2.0 授权,旨在允许使用并促进人工智能技术的进一步发展。有关详细信息,请参阅模型存储库根目录中的 LICENSE 文件。

6. 免责声明

由于 openPangu-2.0-Flash (“模型”)所依赖的技术固有的限制,以及人工智能生成的内容是由模型自动生成的,华为无法对以下事项做出任何保证:

  • 该模型的输出通过AI算法自动生成,不能排除某些信息可能存在缺陷、不合理或引起不适的可能性,生成的内容不代表华为的态度或立场;
  • 无法保证该模型100%准确、可靠、功能齐全、及时、安全、无错误、不间断、持续稳定或无任何故障;
  • 该模型的输出内容不构成任何建议或决策,也不保证生成的内容的真实性、完整性、准确性、及时性、合法性、功能性或实用性。生成的内容不能替代医疗、法律等领域的专业人士回答您的问题。生成的内容仅供参考,不代表华为的任何态度、立场或观点。您需要根据实际情况做出独立判断,华为不承担任何责任。

7. 反馈

如果有任何意见和建议,请提交issue或联系openPangu@huawei.com。