OCR_Paper_List

OCR related works published in top conferences and journals.

Survey and Review:

文档智能分析与识别前沿：回顾与展望, 刘成林, 金连文, 白翔, 李晓辉, 殷飞，中国图形图像学报，[Paper]
Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing, Yan Shu, Weichao Zeng, Zhenhang Li, Fangmin Zhao, Yu Zhou [Paper]
[arXiv:2407.19889] Self-Supervised Learning for Text Recognition: A Critical Survey, Carlos Penarrubia, Jose J. Valero-Mas, Jorge Calvo-Zaragoza [Paper]

Year-2025

[arXiv:2506.07112] EdgeSpotter: Multi-Scale Dense Text Spotting for Industrial Panel Monitoring, Changhong Fu, Hua Lin, Haobo Zuo, Liangliang Yao, Liguo Zhang [Paper]
Arbitrary Reading Order Scene Text Spotter with Local Semantics Guidance,Jiahao Lyu, Wei Wang, Dongbao Yang, Jinwen Zhong, Yu Zhou [Paper]
OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning, Ling Fu, Biao Yang, Zhebin Kuang, Jiajun Song, Yuzhe Li, Linghao Zhu, Qidi Luo, Xinyu Wang, Hao Lu, Mingxin Huang, Zhang Li, Guozhi Tang, Bin Shan, Chunhui Lin, Qi Liu, Binghong Wu, Hao Feng, Hao Liu, Can Huang, Jingqun Tang, Wei Chen, Lianwen Jin, Yuliang Liu, Xiang Bai [Paper] [Project Page]

Year 2024

[arXiv:2409.01704] General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model, Haoran Wei, Chenglong Liu, Jinyue Chen [Paper] [Code]
[IJCAI 2024] Zhou, Bangbang, et al. "Focus on the Whole Character: Discriminative Character Modeling for Scene Text Recognition." arXiv preprint arXiv:2407.05562 (2024). [Paper] [Code]
[ECCV 2024] WAS: Dataset and Methods for Artistic Text Segmentation, Xudong Xie, Yuzhe Li, Yang Liu, Zhifei Zhang, Zhaowen Wang, Wei Xiong, Xiang Bai [Paper] [Code]
[arXiv:2407.17020] EAFormer: Scene Text Segmentation with Edge-Aware Transformers, Haiyang Yu, Teng Fu, Bin Li, Xiangyang Xue [Paper]
[arXiv:2406.19101] DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming, Jiaxin Zhang, Wentao Yang, Songxuan Lai, Zecheng Xie, Lianwen Jin [Paper]
[IJCAI 2024] Self-Supervised Pre-training with Symmetric Superimposition Modeling for Scene Text Recognition, arXiv:2405.05841, Zuan Gao, Yuxin Wang, Yadong Qu, Boqiang Zhang, Zixiao Wang, Jianjun Xu, Hongtao Xie [Paper]
Visually Guided Generative Text-Layout Pre-training for Document Intelligence, NAACL 2024, Zhiming Mao, Haoli Bai, Lu Hou, Jiansheng Wei, Xin Jiang, Qun Liu, Kam-Fai Wong [NAACL 2024]
TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document, Yuliang Liu, Biao Yang, Qiang Liu, Zhang Li, Zhiyin Ma, Shuo Zhang, Xiang Bai [Paper] [Code]
Efficiently Leveraging Linguistic Priors for Scene Text Spotting, Nguyen Nguyen, Yapeng Tian, Chenliang Xu [Paper]
Enhancing Visual Document Understanding with Contrastive Learning in Large Visual-Language Models, Xin Li, Yunfei Wu, Xinghua Jiang, Zhihao Guo, Mingming Gong, Haoyu Cao, Yinsong Liu, Deqiang Jiang, Xing Sun [Paper]
[PR-2024] Class-Aware Mask-Guided Feature Refinement for Scene Text Recognition, Mingkun Yang, Biao Yang, Minghui Liao, Yingying Zhu, Xiang Bai [Paper] [Code]

Year-2023

STEP - Towards Structured Scene-Text Spotting, Sergi Garcia-Bordils1,2 Dimosthenis Karatzas1 Marc¸al Rusinol, [Paper] [Code]

CVPR-2023

Self-supervised Implicit Glyph Attention for Text Recognition,Tongkun Guan1, Chaochen Gu2*, Jingzheng Tu2, Xue Yang1, Qi Feng2, Yudi Zhao2, Wei Shen1* [Paper] [Code]

ICCV-2023

Self-supervised Character-to-Character Distillation for Text Recognition,Tongkun Guan1, Wei Shen1, Xue Yang1, Qi Feng2, Zekun Jiang1, Xiaokang Yang1 [Paper] [Code]

arXiv Papers

Relational Contrastive Learning for Scene Text Recognition, Jinglei Zhang, Tiancheng Lin, Yi X, Kai Chen, Rui Zhang, [Paper] [Code]
Context Perception Parallel Decoder for Scene Text Recognition, Yongkun Du1, Zhineng Chen1*, Caiyan Jia2, Xiaoting Yin3, Chenxia Li3, Yuning Du3, Yu-Gang Jiang1, [Paper] [Code]
Revisiting Scene Text Recognition: A Data Perspective,Qing Jiang , Jiapeng Wang , Dezhi Peng , Chongyu Liu , Lianwen Jin†, [Paper] [Code]
Enhancing Table Recognition with Vision LLMs:A Benchmark andNeighbor-Guided Toolchain Reasoner,Yitong Zhou1, Mingyue Cheng1, Qingyang Mao1, Qi Liu1, Feiyang Xu2, Xin Li2, Enhong Chen1， [Paper]

ECCV-2022

IJCAI 2022

CVPR-2022

Knowledge Mining with Scene Text for Fine-Grained Recognition, Hao Wang1*, Junchao Liao1*, Tianheng Cheng1, Zewen Gao1, Hao Liu2, Bo Ren2, Xiang Bai1, Wenyu Liu1†, [Paper] [Code]

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OCR_Paper_List

Survey and Review:

Year-2025

Year 2024

Year-2023

CVPR-2023

ICCV-2023

arXiv Papers

ECCV-2022

IJCAI 2022

CVPR-2022

AAAI-2022

ICCV-2021

CVPR-2021

NeurIPS 2021

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

License

Event-AHU/OCR_Paper_List

Folders and files

Latest commit

History

Repository files navigation

OCR_Paper_List

Survey and Review:

Year-2025

Year 2024

Year-2023

CVPR-2023

ICCV-2023

arXiv Papers

ECCV-2022

IJCAI 2022

CVPR-2022

AAAI-2022

ICCV-2021

CVPR-2021

NeurIPS 2021

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Packages