表格分类模块是计算机视觉系统中的关键组件,负责对输入的表格图像进行分类。该模块的性能直接影响整个表格识别流程的准确性和效率。表格分类模块通常接收表格图像作为输入,利用深度学习算法,根据图像的特征和内容将其分为预定义的类别,例如有线表格和无线表格。表格分类模块的分类结果作为输出用于表格识别流水线。关键指标如下:
| 模型 | Top1 准确率(%) | GPU 推理时间 (ms) [常规模式 / 高性能模式] | CPU 推理时间 (ms) [常规模式 / 高性能模式] | 模型存储大小 (M) |
|---|---|---|---|---|
| PP-LCNet_x1_0_table_cls | 94.2 | 2.35 / 0.47 | 4.03 / 1.35 | 6.6M |
pip install -U paddleocr
pip install -U onnxruntime-gpupaddleocr table_classification -i ./demo.jpg --model_name PP-LCNet_x1_0_table_cls --engine onnxruntimefrom paddleocr import TableClassification
model = TableClassification(
model_name="PP-LCNet_x1_0_table_cls",
engine="onnxruntime",
)
output = model.predict("./demo.jpg", batch_size=1)
for res in output:
res.print()
res.save_to_json(save_path="./output/res.json")