HuggingFace镜像/AceGPT-v2-32B
模型介绍文件和版本分析
下载使用量0

AceGPT

AceGPT 是一个经过全量微调的生成式文本模型集合,尤其专注于阿拉伯语领域。 本仓库是基于 Qwen1.5-32B 开发的 32B 预训练模型的第 2 版。


模型详情

我们发布了 AceGPT 系列大型语言模型,这是一个经过全量微调的生成式文本模型集合,参数规模从 70 亿到 700 亿不等。我们的模型包括两大类别:AceGPT 和 AceGPT-chat。AceGPT-chat 是专为对话应用优化的版本。值得一提的是,在多项基准测试中,我们的模型表现优于所有当前可用的开源阿拉伯语对话模型。

模型开发者

我们来自阿卜杜拉国王科技大学(KAUST)、香港中文大学(深圳)(CUHKSZ)、深圳大数据研究院(SRIBD)和阿卜杜勒阿齐兹国王大学(KAU)。

模型变体

AceGPT 系列有多种参数规模——7B、8B、13B、32B 和 70B,每种模型规模都有基础版和 -chat 版。

论文

论文可通过以下链接获取:link。

输入

模型仅输入文本。

输出

模型仅输出文本。

模型评估结果

阿拉伯语基准测试在 Arabic MMLU 上进行,使用准确率作为指标,遵循 https://github.com/FreedomIntelligence/AceGPT/tree/main 提供的评估框架。

Arabic-trans MMLUArabicMMLU (koto et al.)Arabic EXAMSArabic ACVA cleanArabic ACVA allArabic AraTrustArabic ARC-CArabic Avg.
Qwen1.5-7B42.1446.4138.3475.1775.8854.2145.5653.96
Jais-30B-v343.4244.4745.7883.3979.5162.6445.5657.82
Llama3-8B47.2245.7846.3477.4976.6867.8247.5358.41
AceGPT-v2-8B48.4150.1746.1580.1478.8465.9049.9159.93
ChatGPT 3.5 Turbo49.0757.7045.9374.4576.8865.1360.2461.34
Qwen1.5-32B55.9055.9452.8478.9180.0769.3467.6665.81
Qwen1.5-72B60.2461.2354.4182.9881.2075.9376.7970.40
AceGPT-v2-32B58.7165.6752.7482.6681.0480.4671.6970.42
Llama3-70B65.1665.6754.7883.4882.9274.8477.3072.02
AceGPT-v2-70B65.1967.7156.1984.7980.9380.9380.9373.81
GPT-465.0672.5057.7684.0679.4390.0485.6776.36

英语和中文基准测试使用 OpenCompass 框架进行。

MMLURACEEnglish Avg.CMMLUCEvalChinese Avg.Avg.
Jais-30B-v342.5330.9636.7525.2622.1723.7230.23
AceGPT-v2-8B65.4860.4962.9953.4450.3751.9157.45
Llama3-8B66.5765.9266.2550.7049.7850.2458.24
ChatGPT 3.5 Turbo69.0383.0076.0253.9052.5053.2064.60
Qwen1.5-7B62.1582.1972.1771.7973.6172.7072.44
AceGPT-v2-70B76.7180.4878.6068.9766.8767.9273.26
GPT-483.0091.0087.0071.0069.9070.4578.73
Llama3-70B79.3484.7682.0568.2967.2167.7574.90
Qwen1.5-32B75.1083.2979.2083.1282.6882.9081.05
AceGPT-v2-32B74.5288.6881.6081.3682.4181.8981.74
Qwen1.5-72B75.7888.2382.0183.1183.0483.0882.54

样本

样本1(抽象代数)

  • 输入: "以下是抽象代数的多项选择题(含答案)\n\n问题:求Z₃中所有使得Z₃[x]/(x²+c)为域的c值。\nA. 0\nB. 1\nC. 2\nD. 3\n答案:B\n\n问题:陈述1 | 若aH是商群中的元素,则|aH|整除|a|。陈述2 | 若H和K是G的子群,则HK是G的子群。\nA. 正确,正确\nB. 错误,错误\nC. 正确,错误\nD. 错误,正确\n答案:B\n\n问题:表述1 | 群中的每个元素都生成该群的一个循环子群。表述2 | 对称群S₁₀有10个元素。\nA. 正确,正确\nB. 错误,错误\nC. 正确,错误\nD. 错误,正确\n答案:C\n\n问题:陈述1| 每个从有限集到自身的函数都必定是双射。陈述2 | 阿贝尔群的每个子群都是阿贝尔群。\nA. 正确,正确\nB. 错误,错误\nC. 正确,错误\nD. 错误,正确\n答案:A\n\n问题:求环2Z的特征。\nA. 0\nB. 3\nC. 12\nD. 30\n答案:A\n\n问题:Q(sqrt(2), sqrt(3), sqrt(18))在Q上的域扩张次数是多少?\nA. 0\nB. 4\nC. 2\nD. 6\n答案:"

  • 输出: " D\n\n问题:群的数量是"

样本2(商业伦理)

  • 输入: "以下是商业伦理的多项选择题(含答案)\n\n问题:与公司社会责任相关的伦理论据有哪些?\nA. 外部成本、权力、自主性\nB. 透明度、弱势群体、合作交换\nC. 透明度、权力、自主性\nD. 外部成本、权力、合作交换\n答案:D\n\n问题:是通过特定的政策、实践和计划,正式或非正式地直接尝试管理伦理问题或困境。\nA. 公司社会责任\nB. 实践伦理管理\nC. 可持续性\nD. 环境管理\n答案:B\n\n问题:为确保独立董事的独立性,可以采取若干步骤,包括从_______公司选择非执行董事,任命他们任期__,以及_________任命他们。\nA. 公司外部,有限,独立地\nB. 公司内部,有限,间歇地\nC. 公司外部,无限,间歇地\nD. 公司内部,无限,独立地\n答案:A\n\n问题:寻求实现其目标的安全经理可以选择哪些方法?\nA. 直接非暴力行动,直接暴力行动,间接行动,宣传活动\nB. 间接行动,破坏行动,直接非暴力行动,媒体宣传\nC. 间接行动,直接暴力行动,直接非暴力直接行动,宣传活动\nD. 直接非暴力行动,破坏行动,间接行动,媒体宣传\n答案:C\n\n问题:与_______不同,旨在奖励公司的积极行为。此类活动的成功通过使用___________得到加强,这使得活动能够促进公司实现__。\nA. 消费活动,公共消费活动,区块链技术,慈善捐赠\nB. 激励活动,公共消费活动,数字技术,增加销售\nC. 消费活动,购买活动,区块链技术,慈善捐赠\nD. 制裁,激励活动,数字活动,增加销售\n答案:D\n\n问题:如比特币变得越来越普及,并带来了一系列相关的伦理影响,例如,它们_______且更。然而,它们也被用于参与_______。\nA. 加密货币,成本高,安全,金融犯罪\nB. 传统货币,成本低,不安全,慈善捐赠\nC. 加密货币,成本低,安全,金融犯罪\nD. 传统货币,成本高,不安全,慈善捐赠\n答案:"

  • 输出: " C\n\n问题:一些方法是"

参考文献

@article{zhu2024second,
  title={Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion},
  author={Zhu, Jianqing and Huang, Huang and Lin, Zhihang and Liang, Juhao and Tang, Zhengyang and Almubarak, Khalid and Alharthi, Mosen and An, Bang and He, Juncai and Wu, Xiangbo and Yu, Fei and Chen, Junying and Ma, Zhuoheng and Du, Yuhao and Hu, Yan and Zhang, He and Alghamdi, Emad A. and Zhang, Lian and Sun, Ruoyu and Li, Haizhou and Wang, Benyou and Xu, Jinchao},
  journal={},
  year={2024}
}