Github热榜:中英文识别OCR模型,百度开源媲美收费软件!

近日,百度飞桨正式开源了业界最小的超轻量8.6M中英文识别OCR模型套件PaddleOCR,在模型大小、精度和预测速度上,甚至超过了之前一度登上GitHub热榜的chineseocr_lite(5.1k stars),简单场景下OCR效果更是能媲美收费软件。

除了性能优越之外,百度PaddleOCR还是第一个完整支持从训练到部署完整流程的OCR模型套件,而且部署方式多样,覆盖手机端(含IOS、Android Demo)、嵌入式端,大规模数据离线预测,在线服务化预测等。通过多种预测工具组件的支持,百度PaddleOCR能够满足多样化的工业级应用场景。同时其支持自定义训练,用户可以使用自己的数据集Fine-tune以达到更好的效果,大大提高了程序员们训练部署OCR模型和项目落地的效率,最大程度上满足了企业的不同需求。

随着百度PaddleOCR的开源,其在促进OCR行业发展的同时,也正在赋能企业,推动产业智能化发展。

近年来,随着技术的发展,文字识别(OCR)已经被广泛的运用至各个场景之中,包括自然场景中文字识别、车牌识别、票据识别等等,是机器服务人类的重要场景之一。

然而目前OCR发展面临着诸多难题,一方面,由于自然环境复杂多样,机器识别面临着尺度、光照不足、拍摄模糊等问题,加大了识别的难度。另外一方面,OCR应用常对接海量数据,要求数据能够得到实时处理。除此之外,由于OCR应用常常部署在移动端或嵌入式硬件,但端侧的存储空间和计算能力有限,因此对OCR模型的大小和预测速度有很高的要求。

而此次百度开源的8.6M超轻量中文OCR模型,包含1个检测模型(4.1M)与1个识别模型(4.5M),是目前业界开源的最小OCR模型。相比于市面上其它的OCR模型,PaddleOCR取得了显著的进展,这使得其能够更为便捷的部署在移动端、嵌入式端等多个场景,更加方便用户使用。

除此之外,百度PaddleOCR也能够快速准确地识别各个场景中的文字,无惧尺度、光照等难题。同时,其还支持中英文识别以及倾斜、竖排等多种方向文字识别,为用户呈现出最佳结果。

来看看下面这些:

由上图可见,这款 OCR 模型的图像文本识别精准度效果破佳,基本可做到从嘈杂环境中快速提取核心信息。
 

如果你 OCR 技术感兴趣,可以扫码下方二维码,加入百度的 OCR 技术群,他们将于 9 月 26 日开设最新技术课程,邀请开发者一起深入探索这项技术未来的应用方向及市场前景:

在遇到 PaddleOCR GitHub 项目的应用问题时,也可以移步到 ISSUE 提问,有丰富经验的飞桨资深工程师帮你解决。

PaddleOCR 项目地址

https://github.com/PaddlePaddle/PaddleOCR

飞桨官网地址

https://www.paddlepaddle.org.cn/

飞桨开源框架项目地址

GitHub:

https://github.com/PaddlePaddle/Paddle

扫码关注公众号获取新鲜技术文章,免费领取前端工程师必备资源