Baichuan-Omni-1d5

Baichuan-Omni-1.5是Baichuan-Omni系列中最新、性能最好的模型。该模型以端到端的方式进行训练和推理。与Baichuan-Omni相比，该模型在文本/图像/音频/视频理解和文本/音频生成方面有了显著改进，并支持可控实时语音对话和多模式实时交互等新功能。

加载镜像

前往昇腾社区/开发资源下载适配本模型的镜像包：1.0.0-800I-A2-py311-openeuler24.03-lts

完成之后，请使用docker images命令确认查找具体镜像名称与标签。

硬件要求

部署Baichuan-Omni-1d5模型至少需要1台800I A2 32G服务器

新建容器

自行修改端口等参数，启动样例

docker run -dit -u root \
--name ${容器名} \
-e ASCEND_RUNTIME_OPTIONS=NODRV \
--privileged=true \
-v /home/路径:/home/路径 \
-v /data:/data \
-v /usr/local/Ascend/driver/:/usr/local/Ascend/driver/ \
-v /usr/local/Ascend/firmware/:/usr/local/Ascend/firmware/ \
-v /usr/local/sbin/:/usr/local/sbin \
-v /etc/ascend_install.info:/etc/ascend_install.info \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
--shm-size=100g \
-p ${映射端口}:22 \
--cap-add=SYS_PTRACE \
--security-opt seccomp=unconfined \
${MindIE 1.0.0 镜像} \
/bin/bash

进入容器

docker exec -it ${容器名} bash

准备模型

首先需要更改dnf配置文件

vi /etc/dnf/dnf.conf

在其中加一行: sslverify=false

[main]
gpgcheck=1
installonly_limit=3
clean_requirements_on_remove=True
best=True
skip_if_unavailable=False
sslverify=false # 新增

之后，用dnf工具安装git

dnf install git

最后，通过git clone命令拉取魔乐社区代码

git clone https://modelers.cn/MindIE/Baichuan-Omni-1d5.git

如果出现报错server certificate verification failed. CAfile: none CRLfile: none则需要增加一行

git config --global http.sslVerify false

目前提供的MindIE镜像预置了 Baichuan-Omni-1d5 模型推理脚本，需将其中的部分代码加入至容器自带的atb-models中

# 将魔乐仓库自带的部分代码拷贝至至容器自带的atb-models中，前者为魔乐仓库的相对路径，可替换为绝对路径
cp -rf Baichuan-Omni-1d5/atb-models /usr/local/Ascend # 重复文件需输入'y'之后回车进行覆盖确认

安装Python依赖以及其他三方依赖

cd /usr/local/Ascend/atb-models
dnf install python-cairo-dev
dnf install cairo-devel
pip install -r requirements/models/requirements_baichuan_omni.txt

下载权重

git clone https://modelers.cn/Baichuan/Baichuan-Omni-1d5.git

修改权重配置文件

将权重文件夹下的config.json中的"model_type"的值由"omni"改为"baichuan_omni"

"model_type": "baichuan_omni"

纯模型推理

修改/usr/local/Ascend/atb-models/examples/models/baichuan_omni/run_pa.sh脚本。目前仅支持纯文本、纯图片、纯视频的场景。需修改对应的变量。注意：QUESTION、IMAGE_PATH、VIDEO_PATH中只能有一个不为空。

export ASCEND_RT_VISIBLE_DEVICES=0,1,2,3
QUESTION="" 
IMAGE_PATH=""
VIDEO_PATH=""

运行脚本可参考run_pa.sh同级目录下的README.md。

bash /usr/local/Ascend/atb-models/examples/models/baichuan_omni/run_pa.sh --run ${权重路径}

声明

本代码仓提到的数据集和模型仅作为示例，这些数据集和模型仅供您用于非商业目的，如您使用这些数据集和模型来完成示例，请您特别注意应遵守对应数据集和模型的License，如您因使用数据集或模型而产生侵权纠纷，华为不承担任何责任。
如您在使用本代码仓的过程中，发现任何问题（包括但不限于功能问题、合规问题），请在本代码仓提交issue，我们将及时审视并解答。