Ascend-SACT/PP-OCRv4_server_seal_det-300I-Duo
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

PP-OCRv4_server_seal_det —— 300I-Duo环境推理指导(Paddle 模型 -> ONNX -> OM)

PP-OCRv4_server_seal_det 是 PaddleOCR 推出的服务端高精度印章文本检测模型,用于定位图像中弧形 / 圆形印章的文字区域,是印章识别链路的核心模块。

本文档介绍了PP-OCRv4_server_seal_det模型的部署流程,包括推理环境准备、模型部署、功能验证,旨在帮助用户快速完成模型300I-Duo环境部署和验证。

概述

推理环境准备

配套版本
固件与驱动25.2.RC1
CANN8.3.RC2
Python3.11
推荐使用镜像cann8.3.rc2-310p-ubuntu22.04

快速上手

环境配置

1.安装依赖

git clone https://atomgit.com/zDaPao/PP-OCRv4_server_seal_det.git
pip install -r requirements.txt
cp -f predictor.py /usr/local/python3.11.13/lib/python3.11/site-packages/paddlex/inference/models/text_detection/

2.安装msit工具以及相关组件

pip install msit
msit install surgeon
wget https://aisbench.obs.myhuaweicloud.com/packet/ais_bench_infer/0.0.2/ait/ais_bench-0.0.2-py3-none-any.whl
wget https://aisbench.obs.myhuaweicloud.com/packet/ais_bench_infer/0.0.2/ait/aclruntime-0.0.2-cp311-cp311-linux_aarch64.whl
pip install ais_bench-0.0.2-py3-none-any.whl
pip install aclruntime-0.0.2-cp311-cp311-linux_aarch64.whl

3.配置CANN环境变量

执行以下命令激活CANN环境变量。注意:该命令中文件路径仅供参考,请以实际安装环境配置环境变量。

source /usr/local/Ascend/ascend-toolkit/set_env.sh

获取权重

下载PP-OCRv4_server_seal_det模型权重,并放置于本地目录PP-OCRv4_server_seal_det

mkdir PP-OCRv4_server_seal_det
modelscope download --model PaddlePaddle/PP-OCRv4_server_seal_det --local_dir ./PP-OCRv4_server_seal_det

模型推理

模型转换

1.导出onnx模型

paddlex --paddle2onnx --paddle_model_dir PP-OCRv4_server_seal_det/ --onnx_model_dir PP-OCRv4_server_seal_det

转onnx的必要性:

1.Paddle 格式 不能直接在昇腾 310P 上运行

2.ONNX 是通用中间格式

3.这是转 OM 模型必须的第一步

2.onnx模型优化 通过auto_optimizer对onnx模型进行改图优化。

python3 -m auto_optimizer optimize PP-OCRv4_server_seal_det/inference.onnx PP-OCRv4_server_seal_det/inference_opt.onnx

优化的必要性:

1.原始 ONNX 有冗余算子、低效结构

2.昇腾对优化后的 ONNX 兼容性更好

3.优化后:推理更快 + 成功率更高 + 性能更高

4.不优化 可能转 OM 失败、推理变慢

3.导出om模型

参照ATC工具指导 ,执行npu-smi info查看芯片名称,并赋值为${soc_version},执行ATC命令,生成PP-OCRv4_server_seal_det的om模型,文件名为inference_{arch}.om,模型{arch}后缀为当前使用的CPU操作系统。

atc --model=PP-OCRv4_server_seal_det/inference_opt.onnx \
    --framework=5 \
    --output=PP-OCRv4_server_seal_det/inference_linux_arch64 \
    --soc_version=Ascend310P3 \
    --input_shape="x:-1,3,640,640" \
    --log=info

参数含义:

参数取值详细解释
--modelPP-OCRv4_server_seal_det/inference_opt.onnx指定待转换的ONNX 模型文件路径,为转换的原始输入模型
--framework5源模型框架标识,5 代表 ONNX 框架;0=Caffe、3=TensorFlow、5=ONNX
--outputPP-OCRv4_server_seal_det/inference_linux_arch64输出 OM 模型前缀路径,工具自动补.om后缀,生成最终推理模型文件
--soc_versionAscend310P3指定适配的昇腾芯片型号,必须与硬件实际芯片完全匹配
--input_shapex:-1,3,640,640模型输入维度配置:・x:输入节点名称・-1:动态 batch,支持任意数量图片同时推理・3:RGB 三通道・640:模型输入高度・640:模型输入宽度
--loginfo日志输出级别,info 为输出常规编译信息,方便排查转换报错
注意:atc工具失效可能是python动态库配置问题,参考如下指令添加动态库路径,具体设置以实际python路径为准
export LD_LIBRARY_PATH=/usr/local/python3.11.10/lib:$LD_LIBRARY_PATH

运行推理脚本

获取示例图像存放在工作路径,并执行推理脚本,脚本通过调用PaddleOCR接口进行产线推理,通过指定文本检测模块以及文本识别模块,解决了文本识别任务,将图片中的文字信息以文本形式输出。

wget https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/seal_text_det.png -O test_seal.png
python3 infer.py

推理执行完成后结果如下,解析结果存放于output目录,目录包含存有各项中间结果的json文件以及可视化结果图像。

[INFO] acl init success
[INFO] open device 0 success
[INFO] create new context
[INFO] load model PP-OCRv4_server_seal_det/inference_linux_aarch64.om success
[INFO] create model description success
{'res': {'input_path': 'test_seal.png', 'page_index': None, 'dt_polys': [array([[469, 473],
       ...,
       [465, 475]]), array([[442, 444],
       ...,
       [438, 443]]), array([[466, 347],
       ...,
       [461, 346]]), array([[324,  38],
       ...,
       [321,  37]])], 'dt_scores': [0.9919230306875793, 0.9831813573077364, 0.9910957775794139, 0.9901800702081646]}}
[INFO] unload model success, model Id is 1
[INFO] end to reset device 0
[INFO] end to finalize acl

推理结果: 示例图片

性能测试

1.下载测试集:

mkdir -p dataset
# 下载官方 demo 数据集(公开、可用)
wget https://paddle-model-ecology.bj.bcebos.com/paddlex/data/ocr_curve_det_dataset_examples.tar -P ./dataset
# 解压
tar -xf ./dataset/ocr_curve_det_dataset_examples.tar -C ./dataset/

2.执行性能测试:

python eval_seal_det.py

3.执行结果:

⚡  PP-OCRv4 印章文字检测 纯性能测试结果 ⚡
======================================================================
✅ 测试图片数量   : 758 张
✅ 总推理耗时     : 24.72 秒
✅ 单张平均耗时   : 32.62 ms
✅ 推理速度 FPS   : 30.66 帧/秒
======================================================================