Poro 34B Chat

Poro 34B chat 是 Poro 34B 的对话优化版本，经过训练可遵循芬兰语和英语的指令。量化版本可在 Poro 34B-chat-GGUF 获取。

由于芬兰语指令调优数据有限，我们利用 Poro 34B 基础模型将英语数据集中的文档机器翻译为芬兰语，然后用于训练此对话版本。我们仅选择可用于商业用途的数据集，且仅包含以符合服务条款方式收集的合成数据。

有关我们芬兰语数据集的数据选择和翻译过程的更多信息，请参见 LumiOpen/instruction-collection-fin 页面。

Poro 是由 Silo AI 的 SiloGen、图尔库大学的 TurkuNLP 团队以及高性能语言技术（HPLT）合作创建的。训练在 LUMI 超级计算机上进行，使用由芬兰 IT 科学中心 CSC 慷慨提供的计算资源。

该项目是为非英语语言（尤其是像芬兰语这样的低资源语言）创建开源大型语言模型的持续努力的一部分。通过结合英语和芬兰语训练数据，我们得到的模型不仅性能优于以往仅基于芬兰语的模型，还能流畅使用英语和代码，并具备基本的英芬互译能力。

微调

Poro-34B-Chat 是在 Poro-34B 基础上，针对一系列芬兰语和英语指令数据集进行的 SFT（监督微调）。该数据集集合大致由 40% 英语、40% 芬兰语和 20% 跨语言条目组成。

我们对基础模型进行了 3 个 epoch 的微调，学习率为 2e-05，预热比例为 0.1，全局批大小为 48。对于全参数微调，我们使用了 3 个节点（每个节点 8 块 GPU）。微调代码采用 Alignment Handbook。

数据集

芬兰语及跨语言

LumiOpen/instruction-collection-fin

英语

对话模板

我们采用 ChatML 对话模板。例如：

<|im_start|>system 
You can add an optional system prompt here.<|im_end|> 
<|im_start|>user 
Miten rakennan tietokoneen?<|im_end|>
<|im_start|>assistant

评估结果

我们采用了广受欢迎的MTBench基准来评估多轮对话性能。

由于MTBench是纯英文基准，我们还发布了MTBench Finnish的这一分支版本，该版本支持多语言并包含机器翻译的芬兰语提示词。以下是我们在这两个基准上的得分情况。

注：更新于2024年6月18日

评估基准	总体	编码	信息提取	人文科学	数学	推理	角色扮演	理工科	写作
MTBench 英文版	6.13	4.25	6.65	9.60	2.30	4.30	7.05	7.55	7.35
MTBench 芬兰语版	6.06	3.70	6.37	9.25	1.20	4.35	7.35	7.80	8.50

许可证

Poro-34B-chat基于Apache 2.0许可证发布。

引用

@misc{luukkonen2024poro,
      title={Poro 34B and the Blessing of Multilinguality},
      author={Risto Luukkonen and Jonathan Burdge and Elaine Zosa and Aarne
Talman and Ville Komulainen and Väinö Hatanpää and Peter Sarlin and Sampo
Pyysalo},
      year={2024},
      eprint={2404.01856},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}