Skip to content

zhangyubo0722/TextRec_Labeler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

一、基于PaddleOCR的文本识别标注工具

说明: 本工具主要是对PaddleOCR的文本识别结果进行重新标注,方便后续训练。

1. 安装

pip install -r requirements.txt

2. 工具使用

2.1 使用PaddleOCR对图片进行预测,得到识别结果

PaddleOCR提供了一系列识别模型以及模型预测方法,点击这里查看预测流程。

以PaddleOCR提供的PP-OCRv4模型为例,预测命令如下:

cd /path/to/PaddleOCR
# 预测多张图片
python3 tools/infer_rec.py -c configs/rec/PP-OCRv4/ch_PP-OCRv4_rec.yml -o Global.pretrained_model={path/to/weights}/best_accuracy Global.infer_img={path/to/images} Global.save_res_path=./output/rec_res.txt

其中,{path/to/weights} 为模型权重所在的路径,{path/to/images} 为待预测图片目录所在路径,rec_res.txt 为预测结果文件,我们后续要根据此预测结果文件对图片进行重新标注。

2.2 使用本工具对PaddleOCR的识别结果进行重新标注

cd /path/to/ocr_rec_labeled_tools

启动命令

python tools.py --file_name xxx.txt --server_name xx.xx.xx.xx --server_port xxx

--file_name PaddleOCR的识别结果,--server_name--server_port 为服务器的ip地址和端口号。 启动后,在浏览器中输入 http://xx.xx.xx.xx:xxx/,进入标注页面。

2.3 窗口功能

点击 上一张下一张 按钮,选择需要标注的图片。窗口 模型预测结果 可显示PaddleOCR的识别结果,在图片真实标签,可在此进行标注处可对标签进行修改,若模型预测结果正确,则无需修改。

标注前需在 标注文件保存路径 处修改标注结果保存位置,标注完成后,点击 更新标注文件 按钮,将当前图片的标签保存到指定路径。

若需跳转至指定图片,在 输入跳转图片索引 处输入图片索引即可。

标注后的结果请查看 标注文件保存路径 中输入的文件路径。

注意: 为确保标注结果及时保存,请在前端页面断开前,点击 更新标注文件 按钮(命令行启动命令kill,网络断开等,都会导致前端页面断开)。

二、图像分类工具

说明: 本工具主要是对本地图像数据进行分类,方便构建评估集。

1. 安装

pip install -r requirements.txt

2. 工具使用

cd /path/to/ocr_rec_labeled_tools

启动命令

python cls_tools.py --file_name xxx.txt --server_name xx.xx.xx.xx --server_port xxx --output_file xxx.txt

--file_name 图片标注文件路径, --server_name--server_port 为服务器的ip地址和端口号,--output_file 为更新后的标注结果保存路径。 启动后,在浏览器中输入 http://xx.xx.xx.xx:xxx/,进入标注页面。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages