HuggingFace镜像/layoutlmv3-finetuned-invoice
模型介绍文件和版本分析
下载使用量0

LayoutLM-v3 模型在发票数据集上的微调

该模型是 microsoft/layoutlmv3-base 在发票数据集上的微调版本。

我们使用在发票数据集上训练的 Microsoft LayoutLMv3 来预测开票方名称、开票方地址、开票方邮政编码、到期日、商品及服务税(GST)、发票日期、发票编号、小计和总计。使用时,只需上传图片或使用下方的示例图片,结果将在几秒钟内显示。

其在评估集上取得了以下结果:

  • 损失:0.0012
  • 精确率:1.0
  • 召回率:1.0
  • F1 值:1.0
  • 准确率:1.0

模型描述

需要更多信息

预期用途与局限性

需要更多信息

训练和评估数据

所有训练代码可从以下 GitHub 链接获取:

https://github.com/Theivaprakasham/layoutlmv3

可通过 HuggingFace Spaces 链接对模型进行评估:

https://huggingface.co/spaces/Theivaprakasham/layoutlmv3_invoice

训练过程

训练超参数

训练过程中使用了以下超参数:

  • 学习率:1e-05
  • 训练批次大小:2
  • 评估批次大小:2
  • 随机种子:42
  • 优化器:Adam,参数 betas=(0.9, 0.999),epsilon=1e-08
  • 学习率调度器类型:线性
  • 训练步数:2000

训练结果

训练损失轮次步数验证损失精确率召回率F1 值准确率
无日志2.01000.08780.9680.98170.97480.9966
无日志4.02000.02410.9720.98580.97890.9971
无日志6.03000.01860.9720.98580.97890.9971
无日志8.04000.01840.98540.95740.97120.9956
0.130810.05000.01210.9720.98580.97890.9971
0.130812.06000.00760.99390.98780.99080.9987
0.130814.07000.00471.00.99590.99800.9996
0.130816.08000.00360.99600.99800.99700.9996
0.130818.09000.00450.99600.99800.99700.9996
0.006920.010000.00430.99600.99800.99700.9996
0.006922.011000.00161.01.01.01.0
0.006924.012000.00151.01.01.01.0
0.006926.013000.00141.01.01.01.0
0.006928.014000.00131.01.01.01.0
0.002630.015000.00121.01.01.01.0
0.002632.016000.00121.01.01.01.0
0.002634.017000.00111.01.01.01.0
0.002636.018000.00111.01.01.01.0
0.002638.019000.00111.01.01.01.0
0.00240.020000.00111.01.01.01.0

框架版本

  • Transformers 4.20.0.dev0
  • Pytorch 1.11.0+cu113
  • Datasets 2.2.2
  • Tokenizers 0.12.1