在实际理解并掌握PaddleOCR的模型训练,模型评估,模型导出实操之前,我觉得有必要先下载他们已经训练好的推理模型,直接进行模型预测,感受下实际推理模型的使用。
由于PaddleOCR的文档内容比较杂乱,实践期间发现了很多问题,包括PaddleOCR的版本不同,目录结构的差异等。所以我记录下我自己的实战经验。
安装环境
机器环境:Mac M1芯片 ARM64架构
PaddleOCR版本:2.6
Python版本:3.9
PaddleOCR的推理模型库
PaddleOCR已经帮你整理好了对应算法的模型列表,包括推理模型,训练模型,预训练模型以及nb模型,网址如下:
本次我们需要下载的就是对应算法:文本检测,文本识别,文本方向分类器对应的推理模型。
在使用PaddleOCR已经发布的推理模型之前,我们需要先将PaddleOCR的代码下载到本地:
git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
具体操作可以参考 juejin.cn/post/718961…
文本检测
我们可以直接参考Paddle的官方文档:github.com/PaddlePaddl…
我的操作步骤如下:
- 首先下载推理模型,我选择了原始超轻量模型,下载到了PaddleOCR/pretrained_models文件夹下
cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
tar -xf ch_PP-OCRv3_det_infer.tar && rm -rf ch_PP-OCRv3_det_infer.tar
这样就可以看到解压出来的推理模型文件夹下有对应的模型文件
- 这样就可以通过命令行的方式执行推理模型了,由于我在MAC上进行CPU运行,需要将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --image_dir="./doc/imgs/" --use_gpu=False
结果运行如下:
文本识别
同样参考的文档如下:github.com/PaddlePaddl…
同样的操作步骤如下:
- 首先下载推理模型,我选择了原始超轻量模型,下载到了PaddleOCR/pretrained_models文件夹下
cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar
tar -xf ch_PP-OCRv3_rec_infer.tar && rm -rf ch_PP-OCRv3_rec_infer.tar
- 这样就可以通过命令行的方式执行推理模型了,由于我在MAC上进行运行,需要将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_rec.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --rec_char_dict_path='./ppocr/utils/ppocr_keys_v1.txt' --use_gpu=False
–image_dir 参数设置为需要识别的图片路径
–rec_model_dir 参数设置为刚刚下载的推理模型的文件夹地址
–rec_char_dict_path 这个参数需要设置为推理模型使用的字符字典,这个字典的地址取值有点绕。由于我们当前下载的是已经打包好的推理模型,需要查看下生成推理模型的对应配置,查询看下图
可以看到推演模型生成时候的配置选择的字典目录路径就是 ppocr/utils/ppocr_keys_v1.txt。
- 执行结果如下
文本方向分类器
同样参考的文档如下:github.com/PaddlePaddl…
同样的操作步骤如下:
- 首先下载推理模型,我选择了原始分类器模型,下载到了PaddleOCR/pretrained_models文件夹下
cd PaddleOCR
mkdir pretrained_models
cd pretrained_models
## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar && rm -rf ch_ppocr_mobile_v2.0_cls_infer.tar
- 这样就可以通过命令行的方式执行推理模型了,由于我在MAC上进行运行,需要将—use_gpu参数设置为False
cd PaddleOCR
python3 tools/infer/predict_cls.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --use_gpu=False
注:PaddleOCR内置的 文本方向分类器只支持了0和180度的分类。如果想支持更多角度,可以自己修改算法进行支持。
文本检测、方向分类和文字识别串联
cd PaddleOCR
python3 tools/infer/predict_system.py --image_dir="/Users/shaoshuai.shao/Desktop/WechatIMG190.jpeg" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --use_angle_cls=true --use_gpu=False
–image_dir 带扫描的图像地址
–det_model_dir 上面文档中下载文本检测推演模型的地址
–rec_model_dir 上面文档中下载文本识别推演模型的地址
–cls_model_dir 上面文档中下载方向分类推演模型的地址
引用
今天的文章如何使用PaddleOCR训练好的推理模型快速进行推理实战分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/14749.html