OLMo-2-0325-32B-Instruct:可用于执行聊天、数学解题、推理评估等多样化任务。该项目是OLMo-2 32B模型的指令微调版本,经Tülu 3数据集监督微调、DPO及RLVR训练,支持多任务处理,开源可访问中间训练 checkpoint。【此简介由AI生成】 - AtomGit AI社区