[!警告]
🚨 目前此模型主要支持英语。我们即将发布支持双语(英语 & 中文)的模型!
过去一年,我们投入了相当多的努力来研究和提升大型语言模型的推理能力,特别关注它们解决算术和数学问题的能力。今天,我们很高兴地介绍我们Qwen2系列的专门针对数学领域的大型语言模型,Qwen2-Math和Qwen2-Math-Instruct-1.5B/7B/72B。Qwen2-Math是一系列基于Qwen2大型语言模型的专用数学语言模型,其数学能力显著超过开源模型,甚至是封闭源模型(例如GPT4o)。我们希望Qwen2-Math能够为科学界解决需要复杂、多步骤逻辑推理的高级数学问题做出贡献。
transformers>=4.40.0 用于Qwen2-Math模型。推荐使用最新版本。[!警告]
🚨 这是必须的,因为 `transformers` 从 `4.37.0` 版本开始集成了Qwen2代码。
关于GPU内存和相应吞吐量的要求,请参阅Qwen2的类似结果。
[!重要]
Qwen2-Math-1.5B-Instruct 是一个用于聊天的指令模型;
Qwen2-Math-1.5B 是一个基础模型,通常用于完成和少量样本推理,作为微调的更好起点。
如果你发现我们的工作有帮助,请随时引用我们。
@article{yang2024qwen2,
title={Qwen2 technical report},
author={Yang, An and Yang, Baosong and Hui, Binyuan and Zheng, Bo and Yu, Bowen and Zhou, Chang and Li, Chengpeng and Li, Chengyuan and Liu, Dayiheng and Huang, Fei and others},
journal={arXiv preprint arXiv:2407.10671},
year={2024}
}当然,请您提供需要翻译的英文文本和相应的 Markdown 格式,我会按照您的要求进行翻译。