SLANeXt_wireless

简介

表格结构识别是表格识别系统的重要组成部分，能够将不可编辑的表格图像转换为可编辑的表格格式（如HTML）。表格结构识别的目标是识别表格中行、列和单元格的位置。该模块的性能直接影响整个表格识别系统的准确性和效率。表格结构识别模块通常输出表格区域的HTML代码，然后将其作为输入传递给表格识别流水线进行进一步处理。

模型	准确率（%）	GPU推理时间（毫秒） [普通模式 / 高性能模式]	CPU推理时间（毫秒） [普通模式 / 高性能模式]	模型存储大小（兆）
SLANeXt_wireless	69.65	--	--	351M

注：SLANeXt_wireless的准确率来自与SLANeXt_wired联合测试的结果。

模型使用

import requests
from PIL import Image
from transformers import AutoImageProcessor, AutoModelForTableRecognition

model_path="PaddlePaddle/SLANeXt_wireless_safetensors"
model = AutoModelForTableRecognition.from_pretrained(model_path, dtype=torch.float32, device_map="auto")
image_processor = AutoImageProcessor.from_pretrained(model_path)

image = Image.open(requests.get("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg", stream=True).raw)
inputs = image_processor(images=image, return_tensors="pt").to(model.device)
outputs = model(**inputs)

results = image_processor.post_process_table_recognition(outputs)

print(result['structure'])
print(result['structure_score'])

SLANeXt_wireless

简介

模型	准确率（%）	GPU推理时间（毫秒） [普通模式 / 高性能模式]	CPU推理时间（毫秒） [普通模式 / 高性能模式]	模型存储大小（兆）
SLANeXt_wireless	69.65	--	--	351M

注：SLANeXt_wireless的准确率来自与SLANeXt_wired联合测试的结果。

模型使用

import requests
from PIL import Image
from transformers import AutoImageProcessor, AutoModelForTableRecognition

model_path="PaddlePaddle/SLANeXt_wireless_safetensors"
model = AutoModelForTableRecognition.from_pretrained(model_path, dtype=torch.float32, device_map="auto")
image_processor = AutoImageProcessor.from_pretrained(model_path)

image = Image.open(requests.get("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg", stream=True).raw)
inputs = image_processor(images=image, return_tensors="pt").to(model.device)
outputs = model(**inputs)

results = image_processor.post_process_table_recognition(outputs)

print(result['structure'])
print(result['structure_score'])