HuggingFace镜像/AceGPT-7B-chat
模型介绍文件和版本分析
下载使用量0

AceGPT

AceGPT 是基于 LlaMA2 构建的全量微调生成式文本模型系列,尤其专注于阿拉伯语领域。本仓库为 7B-chat 预训练模型的存放地。


模型详情

我们发布了 AceGPT 大语言模型系列,该系列是基于 LlaMA2 构建的全量微调生成式文本模型集合,参数规模涵盖 70 亿至 130 亿。我们的模型包含两大主要类别:AceGPT 和 AceGPT-chat。其中,AceGPT-chat 是专门针对对话应用优化的版本。值得一提的是,在多项基准测试中,我们的模型表现优于目前所有已公开的阿拉伯语对话模型。此外,在人类评估中,我们的模型在阿拉伯语方面的满意度已达到部分闭源模型(如 ChatGPT)的水平。

模型开发者

我们来自香港中文大学(深圳)数据科学学院、深圳大数据研究院以及阿卜杜拉国王科技大学(KAUST)。

模型变体

AceGPT 系列提供多种参数规模——70 亿和 130 亿,每种规模的模型均包含基础版和 -chat 对话版两个类别。

输入

模型仅输入文本。

输出

模型仅输出文本。

模型评估结果

在 Arabic Vicuna-80 和 Arabic AlpacaEval 上进行了实验。数值为三次运行中相对于 ChatGPT 的平均性能比率。由于原始 Llama-2 模型无法正常生成阿拉伯语文本,因此未报告其结果。

Arabic Vicuna-80Arabic AlpacaEval
Phoenix Chen et al. (2023a)71.92% ± 0.2%65.62% ± 0.3%
Phoenix–multiple-langs Chen et al. (2023b)71.67% ± 0.7%65.36% ± 0.1%
Jais-13B-chat Sengupta et al. (2023)75.40% ± 1.6%74.95% ± 0.2%
AceGPT-7B-chat94.82% ± 0.2%93.81% ± 0.1%
AceGPT-13B-chat100.88% ± 0.4%97.95% ± 0.1%

示例

示例1(alpaca)

  • 问题:

有哪些著名演员是从百老汇开启他们的职业生涯的?

  • 答案:
  1. 莱昂纳多·迪卡普里奥(Leonardo DiCaprio):他的演艺生涯始于百老汇,尽管他因在《华尔街之狼》(The Wolf of Wall Street)和《泰坦尼克号》(Titanic)等电影中的角色而更广为人知。
  2. 弗朗西斯·麦克多曼德(Frances McDormand):她的演艺生涯始于百老汇,并凭借在众多经典戏剧中的角色,在20世纪初成为著名女演员。
  3. 朱迪·丹奇(Judi Dench):她的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名女演员。
  4. 彼得·奥图尔(Peter O'Toole):他的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名男演员。
  5. 马克·里朗斯(Mark Rylance):他的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名男演员。
  6. 詹姆斯·肯恩(James Caan):他的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名男演员。
  7. 伊丽莎白·泰勒(Elizabeth Taylor):她的演艺生涯始于百老汇,并凭借在众多经典戏剧中的角色,在20世纪初成为著名女演员。
  8. 罗伯特·威尔逊(Robert Wilson):他的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名男演员。
  9. 朱迪·加兰(Judy Garland):她的演艺生涯始于百老汇,并凭借在众多经典戏剧中的角色,在20世纪初成为著名女演员。
  10. 马修·布罗德里克(Matthew Broderick):他的演艺生涯始于百老汇,凭借在众多经典戏剧中的出色表演而成为著名男演员。"

示例2(Vicuna)

  • 问题:

我如何提高我的时间管理技能?

  • 答案:
  1. 确定优先级:确定最重要且需要你投入最多精力的任务。
  2. 安排时间表:使用时间表或日历来规划你的时间,并为特定任务设定固定的时间。
  3. 避免浪费时间:避免拖延那些你现在就能完成的工作。
  4. 使用时间管理技巧:使用诸如番茄工作法之类的技巧,即工作25分钟,然后休息5分钟。
  5. 学会说“不”:学会拒绝那些与你的目标和时间表不符的请求。
  6. 利用技术:使用技术应用程序和工具来跟踪时间和管理任务。
  7. 安排休息时间:确保留出休息和放松的时间,以避免疲劳和倦怠感。
  8. 提高组织能力:学习如何有效地组织任务和优先级。
  9. 使用视觉技术:使用图表和图形来跟踪时间和进度。
  10. 改善整体健康:确保获得足够的睡眠、良好的营养和体育锻炼,以提高你的专注力和生产力。
  11. 使用番茄工作法:这种技术要求你连续工作25分钟,然后休息5分钟。
  12. 学会说“不”:你对那些无助于你目标的事情说“不”的能力,可以极大地改善你的时间管理。
  13. 使用深度专注技术:这种技术运用冥想和心理专注等方法来提高专注能力和生产力。
  14. 学会分解任务:学会将大任务分解为更小、更易于管理的任务。
  15. 使用番茄工作法:这种技术要求你连续工作25分钟,然后休息5分钟。
  16. 学会确定优先级:学会确定优先级,并首先专注于最重要的任务。
  17. 使用三列表排序法:这种技术要求你根据重要性和紧急性对任务进行排序,然后先处理最重要的任务。
  18. 学会提高专注力:学会"

参考文献

@article{huang2023acegpt,
  title={AceGPT, Localizing Large Language Models in Arabic},
  author={Huang, Huang and Yu, Fei and Zhu, Jianqing and Sun, Xuening and Cheng, Hao and Song, Dingjie and Chen, Zhihong and Alharthi, Abdulmohsen and An, Bang and Liu, Ziche and others},
  journal={arXiv preprint arXiv:2309.12053},
  year={2023}
}

推理:

from openmind import AutoTokenizer, AutoModelForCausalLM import openmind import torch import torch_npu import argparse

def parse_args(): parser = argparse.ArgumentParser() parser.add_argument( "--model_name_or_path", type=str, help="模型路径", default="LF_AICC/AceGPT-7B-chat", ) args = parser.parse_args() return args

args = parse_args() model = args.model_name_or_path

tokenizer = AutoTokenizer.from_pretrained(model) pipeline = openmind.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, device_map="auto", ) sequences = pipeline( "<|im_start|>user\nP是否等于NP?<|im_end|>\n<|im_start|>assistant\n", max_length=256, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id, ) for seq in sequences: print(f"结果:{seq['generated_text']}")