表格结构识别是表格识别系统的重要组成部分,能够将不可编辑的表格图像转换为可编辑的表格格式(如HTML)。表格结构识别的目标是识别表格中行、列和单元格的位置。该模块的性能直接影响整个表格识别系统的准确性和效率。表格结构识别模块通常输出表格区域的HTML代码,然后将其作为输入传递给表格识别流水线进行进一步处理。
| 模型 | 准确率(%) | GPU推理时间(毫秒) [普通模式 / 高性能模式] | CPU推理时间(毫秒) [普通模式 / 高性能模式] | 模型存储大小(兆) |
|---|---|---|---|---|
| SLANeXt_wireless | 69.65 | -- | -- | 351M |
注:SLANeXt_wireless的准确率来自与SLANeXt_wired联合测试的结果。
import requests
from PIL import Image
from transformers import AutoImageProcessor, AutoModelForTableRecognition
model_path="PaddlePaddle/SLANeXt_wireless_safetensors"
model = AutoModelForTableRecognition.from_pretrained(model_path, dtype=torch.float32, device_map="auto")
image_processor = AutoImageProcessor.from_pretrained(model_path)
image = Image.open(requests.get("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg", stream=True).raw)
inputs = image_processor(images=image, return_tensors="pt").to(model.device)
outputs = model(**inputs)
results = image_processor.post_process_table_recognition(outputs)
print(result['structure'])
print(result['structure_score'])