本镜像为DeepSeek-OCR 基于VLLM-Ascend的开箱镜像,搭配8.3.RC1版本的CANN后,内含启动在线推理服务脚本,可一键式实现服务拉起。
DeepSeek-OCR 是一款两阶段 Transformer 文档 AI,先将页面图像压缩成紧凑的视觉 Token,再以高容量的专家混合语言模型解码。阶段一融合窗口化 SAM 视觉 Transformer、致密 CLIP-Large 编码器与 16× 卷积压缩器;阶段二使用 DeepSeek-3B-MoE 解码器(每个 Token 激活约 5.7 亿参数),以最小损耗重建文本、HTML 与图示标注。
官方论文参考:https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
硬件环境配置:昇腾 Atlas A2/A3推理服务器 NPU卡数≥1
CANN资源:https://www.hiascend.com/developer/download/community/result?module=cann&cann=8.3.RC1 安装下载对应环境所需的ascend-toolkit与kernels。
Ascend DeepSeek-OCR代码参考:https://modelers.cn/models/vLLM_Ascend/DeepSeek-OCR
权重下载链接:
ModelScope:https://www.modelscope.cn/models/deepseek-ai/DeepSeek-OCR
Modelers:https://modelers.cn/models/deepseek-ai/DeepSeek-OCR
开箱镜像链接:https://ai.gitcode.com/Ascend-SACT/DeepSeek-OCR-Ascend-Tested-Images
请保证资源已下载完成:权重、CANN、镜像
chmod +x Ascend-cann-toolkit_8.3.RC1_linux-XXX.run
chmod +x Ascend-cann-kernels-【根据用户环境】_8.3.RC1_linux-XXX.run
./Ascend-cann-toolkit_8.3.RC1_linux-XXX.run --install
./Ascend-cann-kernels-【根据用户环境】_8.3.RC1_linux-XXX.run --install
source /usr/local/Ascend/ascend-toolkit/set_env.sh
git clone https://gitcode.com/Ascend-SACT/DeepSeek-OCR-Ascend-Tested-Images.git
cd DeepSeek-OCR-Ascend-Tested-Images
docker load -i deepseek-ocr-tested-image.tar
#查询导入后的镜像ID
docker images
#更改container.sh
#将获取到的ID填充,并规划容器所需要的卡。
bash container.sh
docker exec -it 容器名 bash
cd vllm
#存在启动服务的脚本:start.sh,更改启动服务脚本和NPU卡即可。(tp默认设置成1)
vim start.sh
###################文件内容########################
export ASCEND_RT_VISIBLE_DEVICES=使用的NPU卡
#权重路径
vllm serve /path/to/model/DeepSeek-OCR \
##################################################
bash start.sh