Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2310.16527

Papers - Multimodal - Document Analysis

Enhancing Document Information Analysis with Multi-Task Pre-training: A Robust Approach for Information Extraction in Visually-Rich Documents

Paper • 2310.16527 • Published Oct 25, 2023 • 2
DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 182
Unifying Vision, Text, and Layout for Universal Document Processing

Paper • 2212.02623 • Published Dec 5, 2022 • 10

Papers - Multimodal - Training and Tuning

Enhancing Document Information Analysis with Multi-Task Pre-training: A Robust Approach for Information Extraction in Visually-Rich Documents

Paper • 2310.16527 • Published Oct 25, 2023 • 2
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection

Paper • 2310.02960 • Published Oct 4, 2023 • 1
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

Paper • 2403.09611 • Published Mar 14, 2024 • 126
Veagle: Advancements in Multimodal Representation Learning

Paper • 2403.08773 • Published Jan 18, 2024 • 9

Papers - Image - Multimodal - Handwriting Recognition

Representing Online Handwriting for Recognition in Large Vision-Language Models

Paper • 2402.15307 • Published Feb 23, 2024 • 3
Evaluating Sequence-to-Sequence Models for Handwritten Text Recognition

Paper • 1903.07377 • Published Mar 18, 2019 • 2
Enhancing Document Information Analysis with Multi-Task Pre-training: A Robust Approach for Information Extraction in Visually-Rich Documents

Paper • 2310.16527 • Published Oct 25, 2023 • 2
Detecting and recognizing characters in Greek papyri with YOLOv8, DeiT and SimCLR

Paper • 2401.12513 • Published Jan 23, 2024 • 1

Papers - Image - Handwriting Recognition

Data Incubation -- Synthesizing Missing Data for Handwriting Recognition

Paper • 2110.07040 • Published Oct 13, 2021 • 2
A Mixture of Expert Approach for Low-Cost Customization of Deep Neural Networks

Paper • 1811.00056 • Published Oct 31, 2018 • 2
Vulnerability Analysis of Transformer-based Optical Character Recognition to Adversarial Attacks

Paper • 2311.17128 • Published Nov 28, 2023 • 2
Data Generation for Post-OCR correction of Cyrillic handwriting

Paper • 2311.15896 • Published Nov 27, 2023 • 3

Papers - Pipeline - Multimodal

Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition

Paper • 2402.15504 • Published Feb 23, 2024 • 21
Enhancing Document Information Analysis with Multi-Task Pre-training: A Robust Approach for Information Extraction in Visually-Rich Documents

Paper • 2310.16527 • Published Oct 25, 2023 • 2

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs