WebRL-Llama-3.1-8B 是智谱 AI 发布的 Llama-3.1-8B 版本的 WebRL 的开源版本。它能够在 WebArena 的五个网站上完成网页操作:OpenStreetMap(地图)、Reddit、GitLab、在线商店内容管理系统(CMS)和 OneStopShop(OSS)。
我们评估了 WebRL-GLM-4-9B 模型在 WebArena-Lite 上的表现,并获得了以下结果:
| 模型 | GitLab | CMS | 地图 | OSS | 平均成功率 | |
|---|---|---|---|---|---|---|
| Llama-3.1-8B-Instruct | 0.0 | 3.3 | 2.9 | 3.3 | 11.1 | 4.8 |
| GLM-4-9B-Chat | 5.3 | 10.0 | 6.7 | 3.3 | 6.7 | 6.1 |
| WebRL-Llama-3.1-8B | 63.2 | 46.7 | 54.3 | 36.7 | 31.1 | 42.4 |
如需了解更多推理代码和要求,请访问我们的 [GitHub 页面](GitHub - THUDM/WebRL)。
如果您认为我们的工作有价值,请在您的论文中引用以下论文。
@artical{qi2024webrl,
title={WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning},
author={Zehan Qi and Xiao Liu and Iat Long Iong and Hanyu Lai and Xueqiao Sun and Xinyue Yang and Jiadai Sun and Yu Yang and Shuntian Yao and Tianjie Zhang and Wei Xu and Jie Tang and Yuxiao Dong},
journal={arXiv preprint arXiv:2411.02337},
year={2024},
}当然可以,不过请您提供需要翻译的文本内容,我才能进行翻译。