一、基于PaddleOCR的文本识别标注工具

说明： 本工具主要是对PaddleOCR的文本识别结果进行重新标注，方便后续训练。

1. 安装

pip install -r requirements.txt

2. 工具使用

2.1 使用PaddleOCR对图片进行预测，得到识别结果

PaddleOCR提供了一系列识别模型以及模型预测方法，点击这里查看预测流程。

以PaddleOCR提供的PP-OCRv4模型为例，预测命令如下：

cd /path/to/PaddleOCR
# 预测多张图片
python3 tools/infer_rec.py -c configs/rec/PP-OCRv4/ch_PP-OCRv4_rec.yml -o Global.pretrained_model={path/to/weights}/best_accuracy Global.infer_img={path/to/images} Global.save_res_path=./output/rec_res.txt

其中，{path/to/weights} 为模型权重所在的路径，{path/to/images} 为待预测图片目录所在路径,rec_res.txt 为预测结果文件,我们后续要根据此预测结果文件对图片进行重新标注。

2.2 使用本工具对PaddleOCR的识别结果进行重新标注

cd /path/to/ocr_rec_labeled_tools

启动命令

python tools.py --file_name xxx.txt --server_name xx.xx.xx.xx --server_port xxx

--file_name PaddleOCR的识别结果，--server_name 和 --server_port 为服务器的ip地址和端口号。启动后，在浏览器中输入 http://xx.xx.xx.xx:xxx/，进入标注页面。

2.3 窗口功能

点击 上一张，下一张 按钮，选择需要标注的图片。窗口 模型预测结果 可显示PaddleOCR的识别结果，在图片真实标签，可在此进行标注处可对标签进行修改，若模型预测结果正确，则无需修改。

标注前需在 标注文件保存路径 处修改标注结果保存位置，标注完成后，点击 更新标注文件 按钮，将当前图片的标签保存到指定路径。

若需跳转至指定图片，在 输入跳转图片索引 处输入图片索引即可。

标注后的结果请查看 标注文件保存路径 中输入的文件路径。

注意： 为确保标注结果及时保存，请在前端页面断开前，点击 更新标注文件 按钮（命令行启动命令kill，网络断开等，都会导致前端页面断开）。

二、图像分类工具

说明： 本工具主要是对本地图像数据进行分类，方便构建评估集。

1. 安装

pip install -r requirements.txt

2. 工具使用

cd /path/to/ocr_rec_labeled_tools

启动命令

python cls_tools.py --file_name xxx.txt --server_name xx.xx.xx.xx --server_port xxx --output_file xxx.txt

--file_name 图片标注文件路径， --server_name 和 --server_port 为服务器的ip地址和端口号，--output_file 为更新后的标注结果保存路径。启动后，在浏览器中输入 http://xx.xx.xx.xx:xxx/，进入标注页面。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
cls_tools.py		cls_tools.py
requirements.txt		requirements.txt
tools.py		tools.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

一、基于PaddleOCR的文本识别标注工具

1. 安装

2. 工具使用

2.1 使用PaddleOCR对图片进行预测，得到识别结果

2.2 使用本工具对PaddleOCR的识别结果进行重新标注

2.3 窗口功能

二、图像分类工具

1. 安装

2. 工具使用

About

Uh oh!

Releases

Packages

Uh oh!

Languages

zhangyubo0722/TextRec_Labeler

Folders and files

Latest commit

History

Repository files navigation

一、基于PaddleOCR的文本识别标注工具

1. 安装

2. 工具使用

2.1 使用PaddleOCR对图片进行预测，得到识别结果

2.2 使用本工具对PaddleOCR的识别结果进行重新标注

2.3 窗口功能

二、图像分类工具

1. 安装

2. 工具使用

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages