这是 Qwen/Qwen-VL-Chat(2023年9月25日前的原始版本)的LLaMA化复刻版,经过重新校准以适配原始LLaMA/LLaMA-2类模型结构。
您可以使用LlamaForCausalLM进行模型推理,这与LLaMA/LLaMA-2模型的使用方式相同(使用由原始tiktoken转换而来的GPT2Tokenizer,由vonjack提供)。
该模型已进行去品牌化编辑,这意味着模型将不再自称为Qwen。
截至目前,该模型已完成权重的数值对齐和初步强化学习,以与原始模型保持一致。通过模型编辑方法,已解决了部分错误和过时知识。此模型与原始版本完全等效,未针对下游任务或其他大规模对话数据集进行专门的有监督微调。
提示词格式:chatml