表格分类模块是计算机视觉系统中的关键组件,负责对输入的表格图像进行分类。该模块的性能直接影响整个表格识别流程的准确性和效率。表格分类模块通常接收表格图像作为输入,利用深度学习算法,根据图像的特征和内容将其分为预定义的类别,例如有线表格和无线表格。表格分类模块的分类结果将作为输出用于表格识别流水线。关键指标如下:
| 模型 | Top1 准确率(%) | GPU 推理时间 (毫秒) [常规模式 / 高性能模式] | CPU 推理时间 (毫秒) [常规模式 / 高性能模式] | 模型存储大小 (M) |
|---|---|---|---|---|
| PP-LCNet_x1_0_table_cls | 94.2 | 2.35 / 0.47 | 4.03 / 1.35 | 6.6M |
import requests
from PIL import Image
from transformers import AutoImageProcessor, AutoModelForImageClassification
model_path = "PaddlePaddle/PP-LCNet_x1_0_table_cls_safetensors"
model = AutoModelForImageClassification.from_pretrained(model_path, device_map="auto")
image_processor = AutoImageProcessor.from_pretrained(model_path)
image = Image.open(requests.get("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg", stream=True).raw)
inputs = image_processor(images=image, return_tensors="pt").to(model.device)
outputs = model(**inputs)
predicted_label = outputs.logits.argmax(-1).item()
print(model.config.id2label[predicted_label])