AceGPT

AceGPT 是基于 LlaMA2 构建的全量微调生成式文本模型集合，尤其专注于阿拉伯语领域。本仓库为 13B-chat 预训练模型的 1.5 版本。

模型详情

我们发布了 AceGPT 系列大型语言模型，这是基于 LlaMA2 的全量微调生成式文本模型集合，参数规模涵盖 7B 至 13B。我们的模型包含两大类别：AceGPT 和 AceGPT-chat。AceGPT-chat 是专为对话应用优化的版本。值得一提的是，在多项基准测试中，我们的模型表现优于所有当前可用的开源阿拉伯语对话模型。此外，在人类评估中，我们的模型在阿拉伯语方面的满意度已达到部分闭源模型（如 ChatGPT）的水平。

模型开发者

我们来自阿卜杜拉国王科技大学（KAUST）、香港中文大学（深圳）（CUHKSZ）、深圳大数据研究院（SRIBD）以及阿卜杜勒阿齐兹国王大学（KAU）。

模型变体

AceGPT 系列提供多种参数规模——7B 和 13B，每种规模的模型均包含基础版和 -chat 版。

输入

模型仅接受文本输入。

输出

模型仅输出文本。

示例

示例 1（抽象代数）

输入： ": فيما يلي أسئلة الاختيار من متعدد حول جبر تجريدي\n\nسؤال: ما هو الدرجة للامتداد الميداني الناتج من Q(sqrt(2), sqrt(3), sqrt(18)) على Q؟\nA. 0\nB. 4\nC. 2\nD. 6\nمن فضلك اختر إجابة واحدة من بين 'A، B، C، D' دون شرح. : "
输出： "B\n\nالشرح:\n\nالامت"

示例 2（商业伦理）

输入： ": فيما يلي أسئلة الاختيار من متعدد حول أخلاقيات الأعمال\n\nسؤال: تُصبح _______ مثل البيتكوين أكثر انتشارًا وتحمل مجموعة كبيرة من الآثار الأخلاقية المرتبطة بها، على سبيل المثال، إنها _______ وأكثر _______. ومع ذلك، تم استخدامها أيضًا للمشاركة في _______.\nA. العملات الرقمية، مكلفة، آمنة، جرائم مالية\nB. العملات التقليدية، رخيصة، غير آمنة، العطاء الخيري\nC. العملات الرقمية، رخيصة، آمنة، جرائم مالية\nD. العملات التقليدية، مكلفة، غير آمنة، العطاء الخيري\nمن فضلك اختر إجابة واحدة من بين 'A، B، C، D' دون شرح. : "
输出： "C\n\nالشرح:\n\nالإ"

参考资料

@article{zhu2024second,
  title={Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion},
  author={Zhu, Jianqing and Huang, Huang and Lin, Zhihang and Liang, Juhao and Tang, Zhengyang and Almubarak, Khalid and Alharthi, Mosen and An, Bang and He, Juncai and Wu, Xiangbo and Yu, Fei and Chen, Junying and Ma, Zhuoheng and Du, Yuhao and Hu, Yan and Zhang, He and Alghamdi, Emad A. and Zhang, Lian and Sun, Ruoyu and Li, Haizhou and Wang, Benyou and Xu, Jinchao},
  journal={},
  year={2024}
}

推理：

from openmind import AutoTokenizer, AutoModelForCausalLM import openmind import torch import torch_npu import argparse

def parse_args(): parser = argparse.ArgumentParser() parser.add_argument( "--model_name_or_path", type=str, help="模型路径", default="LF_AICC/AceGPT-v1.5-13B-Chat", ) args = parser.parse_args() return args

args = parse_args() model = args.model_name_or_path

tokenizer = AutoTokenizer.from_pretrained(model) pipeline = openmind.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, device_map="auto", ) sequences = pipeline( "<|im_start|>user\nP是否等于NP？<|im_end|>\n<|im_start|>assistant\n", max_length=256, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id, ) for seq in sequences: print(f"结果：{seq['generated_text']}")

模型详情

示例

示例 1（抽象代数）

输入： ": فيما يلي أسئلة الاختيار من متعدد حول جبر تجريدي\n\nسؤال: ما هو الدرجة للامتداد الميداني الناتج من Q(sqrt(2), sqrt(3), sqrt(18)) على Q؟\nA. 0\nB. 4\nC. 2\nD. 6\nمن فضلك اختر إجابة واحدة من بين 'A، B، C، D' دون شرح. : "

输出： "B\n\nالشرح:\n\nالامت"

示例 2（商业伦理）

输入： ": فيما يلي أسئلة الاختيار من متعدد حول أخلاقيات الأعمال\n\nسؤال: تُصبح _______ مثل البيتكوين أكثر انتشارًا وتحمل مجموعة كبيرة من الآثار الأخلاقية المرتبطة بها، على سبيل المثال، إنها _______ وأكثر _______. ومع ذلك، تم استخدامها أيضًا للمشاركة في _______.\nA. العملات الرقمية، مكلفة، آمنة، جرائم مالية\nB. العملات التقليدية، رخيصة، غير آمنة، العطاء الخيري\nC. العملات الرقمية، رخيصة، آمنة، جرائم مالية\nD. العملات التقليدية، مكلفة، غير آمنة، العطاء الخيري\nمن فضلك اختر إجابة واحدة من بين 'A، B، C، D' دون شرح. : "

输出： "C\n\nالشرح:\n\nالإ"

参考资料

@article{zhu2024second,
  title={Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion},
  author={Zhu, Jianqing and Huang, Huang and Lin, Zhihang and Liang, Juhao and Tang, Zhengyang and Almubarak, Khalid and Alharthi, Mosen and An, Bang and He, Juncai and Wu, Xiangbo and Yu, Fei and Chen, Junying and Ma, Zhuoheng and Du, Yuhao and Hu, Yan and Zhang, He and Alghamdi, Emad A. and Zhang, Lian and Sun, Ruoyu and Li, Haizhou and Wang, Benyou and Xu, Jinchao},
  journal={},
  year={2024}
}

推理：

from openmind import AutoTokenizer, AutoModelForCausalLM import openmind import torch import torch_npu import argparse

args = parse_args() model = args.model_name_or_path