合并请求 - Pix2:用户可将该项目用于图像 captioning 和视觉问答等任务的微调。它是一个图像编码器-文本解码器模型,通过学习解析网页截图到简化 HTML 进行预训练,能在文档、插图等多领域任务中实现优异性能。【此简介由AI生成】 - AtomGit AI社区