飞桨PaddlePaddle/SLANeXt_wireless_safetensors
模型介绍文件和版本Pull Requests讨论分析

SLANeXt_wireless

简介

表格结构识别是表格识别系统的重要组成部分,能够将不可编辑的表格图像转换为可编辑的表格格式(如HTML)。表格结构识别的目标是识别表格中行、列和单元格的位置。该模块的性能直接影响整个表格识别系统的准确性和效率。表格结构识别模块通常输出表格区域的HTML代码,然后将其作为输入传递给表格识别流水线进行进一步处理。

模型准确率(%)GPU推理时间(毫秒)
[普通模式 / 高性能模式]
CPU推理时间(毫秒)
[普通模式 / 高性能模式]
模型存储大小(兆)
SLANeXt_wireless69.65----351M

注:SLANeXt_wireless的准确率来自与SLANeXt_wired联合测试的结果。

模型使用

import requests
from PIL import Image
from transformers import AutoImageProcessor, AutoModelForTableRecognition

model_path="PaddlePaddle/SLANeXt_wireless_safetensors"
model = AutoModelForTableRecognition.from_pretrained(model_path, dtype=torch.float32, device_map="auto")
image_processor = AutoImageProcessor.from_pretrained(model_path)

image = Image.open(requests.get("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/table_recognition.jpg", stream=True).raw)
inputs = image_processor(images=image, return_tensors="pt").to(model.device)
outputs = model(**inputs)

results = image_processor.post_process_table_recognition(outputs)

print(result['structure'])
print(result['structure_score'])
下载使用量0