针对openMind的修改。
Qwen1.5是Qwen2的测试版,是一款基于Transformer的仅解码器语言模型,在大量数据上进行了预训练。与之前发布的Qwen相比,其改进包括:
trust_remote_code。Qwen1.5是一个语言模型系列,包含不同规模的解码器语言模型。对于每种规模,我们都会发布基础语言模型和经过对齐的聊天模型。该模型基于Transformer架构,采用SwiGLU激活函数、注意力QKV偏置、分组查询注意力、滑动窗口注意力与全注意力混合等技术。此外,我们还改进了分词器,使其能适配多种自然语言和代码。在测试版中,我们暂未包含GQA(32B模型除外)以及滑动窗口注意力与全注意力的混合机制。
Qwen1.5的代码已集成到最新版的Hugging Face Transformers中,建议您安装mindformers=r1.2.0。
export PYTHONPATH={path}/mindformers:$PYTHONPATH
export OPENMIND_FRAMEWORK=mscd examples
python inference.py