AceGPT

AceGPT 是基于 LlaMA2 构建的全量微调生成式文本模型系列，尤其专注于阿拉伯语领域。本仓库为 7B-chat 预训练模型的存放地。

模型详情

我们发布了 AceGPT 大语言模型系列，该系列是基于 LlaMA2 构建的全量微调生成式文本模型集合，参数规模涵盖 70 亿至 130 亿。我们的模型包含两大主要类别：AceGPT 和 AceGPT-chat。其中，AceGPT-chat 是专门针对对话应用优化的版本。值得一提的是，在多项基准测试中，我们的模型表现优于目前所有已公开的阿拉伯语对话模型。此外，在人类评估中，我们的模型在阿拉伯语方面的满意度已达到部分闭源模型（如 ChatGPT）的水平。

模型开发者

我们来自香港中文大学（深圳）数据科学学院、深圳大数据研究院以及阿卜杜拉国王科技大学（KAUST）。

模型变体

AceGPT 系列提供多种参数规模——70 亿和 130 亿，每种规模的模型均包含基础版和 -chat 对话版两个类别。

输入

模型仅输入文本。

输出

模型仅输出文本。

模型评估结果

在 Arabic Vicuna-80 和 Arabic AlpacaEval 上进行了实验。数值为三次运行中相对于 ChatGPT 的平均性能比率。由于原始 Llama-2 模型无法正常生成阿拉伯语文本，因此未报告其结果。

	Arabic Vicuna-80	Arabic AlpacaEval
Phoenix Chen et al. (2023a)	71.92% ± 0.2%	65.62% ± 0.3%
Phoenix–multiple-langs Chen et al. (2023b)	71.67% ± 0.7%	65.36% ± 0.1%
Jais-13B-chat Sengupta et al. (2023)	75.40% ± 1.6%	74.95% ± 0.2%
AceGPT-7B-chat	94.82% ± 0.2%	93.81% ± 0.1%
AceGPT-13B-chat	100.88% ± 0.4%	97.95% ± 0.1%

示例

示例1(alpaca)

问题：

有哪些著名演员是从百老汇开启他们的职业生涯的？

答案：

莱昂纳多·迪卡普里奥（Leonardo DiCaprio）：他的演艺生涯始于百老汇，尽管他因在《华尔街之狼》（The Wolf of Wall Street）和《泰坦尼克号》（Titanic）等电影中的角色而更广为人知。
弗朗西斯·麦克多曼德（Frances McDormand）：她的演艺生涯始于百老汇，并凭借在众多经典戏剧中的角色，在20世纪初成为著名女演员。
朱迪·丹奇（Judi Dench）：她的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名女演员。
彼得·奥图尔（Peter O'Toole）：他的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名男演员。
马克·里朗斯（Mark Rylance）：他的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名男演员。
詹姆斯·肯恩（James Caan）：他的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名男演员。
伊丽莎白·泰勒（Elizabeth Taylor）：她的演艺生涯始于百老汇，并凭借在众多经典戏剧中的角色，在20世纪初成为著名女演员。
罗伯特·威尔逊（Robert Wilson）：他的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名男演员。
朱迪·加兰（Judy Garland）：她的演艺生涯始于百老汇，并凭借在众多经典戏剧中的角色，在20世纪初成为著名女演员。
马修·布罗德里克（Matthew Broderick）：他的演艺生涯始于百老汇，凭借在众多经典戏剧中的出色表演而成为著名男演员。"

示例2(Vicuna)

问题：

我如何提高我的时间管理技能？

答案：

确定优先级：确定最重要且需要你投入最多精力的任务。
安排时间表：使用时间表或日历来规划你的时间，并为特定任务设定固定的时间。
避免浪费时间：避免拖延那些你现在就能完成的工作。
使用时间管理技巧：使用诸如番茄工作法之类的技巧，即工作25分钟，然后休息5分钟。
学会说“不”：学会拒绝那些与你的目标和时间表不符的请求。
利用技术：使用技术应用程序和工具来跟踪时间和管理任务。
安排休息时间：确保留出休息和放松的时间，以避免疲劳和倦怠感。
提高组织能力：学习如何有效地组织任务和优先级。
使用视觉技术：使用图表和图形来跟踪时间和进度。
改善整体健康：确保获得足够的睡眠、良好的营养和体育锻炼，以提高你的专注力和生产力。
使用番茄工作法：这种技术要求你连续工作25分钟，然后休息5分钟。
学会说“不”：你对那些无助于你目标的事情说“不”的能力，可以极大地改善你的时间管理。
使用深度专注技术：这种技术运用冥想和心理专注等方法来提高专注能力和生产力。
学会分解任务：学会将大任务分解为更小、更易于管理的任务。
使用番茄工作法：这种技术要求你连续工作25分钟，然后休息5分钟。
学会确定优先级：学会确定优先级，并首先专注于最重要的任务。
使用三列表排序法：这种技术要求你根据重要性和紧急性对任务进行排序，然后先处理最重要的任务。
学会提高专注力：学会"

参考文献

@article{huang2023acegpt,
  title={AceGPT, Localizing Large Language Models in Arabic},
  author={Huang, Huang and Yu, Fei and Zhu, Jianqing and Sun, Xuening and Cheng, Hao and Song, Dingjie and Chen, Zhihong and Alharthi, Abdulmohsen and An, Bang and Liu, Ziche and others},
  journal={arXiv preprint arXiv:2309.12053},
  year={2023}
}

推理：

from openmind import AutoTokenizer, AutoModelForCausalLM import openmind import torch import torch_npu import argparse

def parse_args(): parser = argparse.ArgumentParser() parser.add_argument( "--model_name_or_path", type=str, help="模型路径", default="LF_AICC/AceGPT-7B-chat", ) args = parser.parse_args() return args

args = parse_args() model = args.model_name_or_path

tokenizer = AutoTokenizer.from_pretrained(model) pipeline = openmind.pipeline( "text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.bfloat16, device_map="auto", ) sequences = pipeline( "<|im_start|>user\nP是否等于NP？<|im_end|>\n<|im_start|>assistant\n", max_length=256, do_sample=True, top_k=10, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id, ) for seq in sequences: print(f"结果：{seq['generated_text']}")