Qwen2-Math-1.5B

[!警告]

🚨 目前此模型主要支持英语。我们即将发布支持双语（英语 & 中文）的模型！

介绍

过去一年，我们投入了相当多的努力来研究和提升大型语言模型的推理能力，特别关注它们解决算术和数学问题的能力。今天，我们很高兴地介绍我们Qwen2系列的专门针对数学领域的大型语言模型，Qwen2-Math和Qwen2-Math-Instruct-1.5B/7B/72B。Qwen2-Math是一系列基于Qwen2大型语言模型的专用数学语言模型，其数学能力显著超过开源模型，甚至是封闭源模型（例如GPT4o）。我们希望Qwen2-Math能够为科学界解决需要复杂、多步骤逻辑推理的高级数学问题做出贡献。

模型详情

更多详细信息，请参阅我们的博客文章和GitHub仓库。

要求

transformers>=4.40.0 用于Qwen2-Math模型。推荐使用最新版本。

[!警告]

🚨 这是必须的，因为 `transformers` 从 `4.37.0` 版本开始集成了Qwen2代码。

关于GPU内存和相应吞吐量的要求，请参阅Qwen2的类似结果。

[!重要]

Qwen2-Math-1.5B-Instruct 是一个用于聊天的指令模型；

Qwen2-Math-1.5B 是一个基础模型，通常用于完成和少量样本推理，作为微调的更好起点。

引用

如果你发现我们的工作有帮助，请随时引用我们。

@article{yang2024qwen2,
  title={Qwen2 technical report},
  author={Yang, An and Yang, Baosong and Hui, Binyuan and Zheng, Bo and Yu, Bowen and Zhou, Chang and Li, Chengpeng and Li, Chengyuan and Liu, Dayiheng and Huang, Fei and others},
  journal={arXiv preprint arXiv:2407.10671},
  year={2024}
}

当然，请您提供需要翻译的英文文本和相应的 Markdown 格式，我会按照您的要求进行翻译。