AI测评丨十二款开源OCR开箱测评,文字识别哪家强

AI测评丨十二款开源OCR开箱测评,文字识别哪家强

什么OCR工具免费开源最好用?

哪个OCR识别印刷类文档图片综合能力最高?

在大规模文档自动化处理中,哪个OCR工具的性能最为稳定?

哪个OCR识别旋转图片准确率最高?

哪个OCR工具在处理低分辨率或模糊图片时表现最佳?

哪个OCR最擅长识别手写文字?

哪个OCR识别复杂的自然场景图片综合能力最强?

哪个OCR识别艺术字表现最好?

……

目前开源OCR工具种类繁多,不同场景图像的识别效果却参差不齐,这给开发人员的选型工作带来了不小的挑战。

为此,广州软件院先进软件测评实验室对12款开源OCR工具进行了全面测试,旨在提供客观准确的选型依据。这些工具包括PaddleOCR、RapidOCR、读光(开源版)、ChineseOCR、EasyOCR、Tesseract、OcrLiteOnnx、Surya、docTR、JavaOCR等独立工具,以及RagFlow、Unstructured等文档分析OCR组件。

评估基于五类数据集,包括印刷中文、印刷英文、手写文字、自然场景和变形字体,考察了字符集覆盖范围(生僻字)、字体形变(艺术字、验证码)以及图像旋转、干扰信息、光照条件、模糊等外部因素的影响。选用的数据集涵盖了Synthetic Chinese String、CTW、ICDAR 2019 - ArT、Chinese MNIST、CASIA HWDB2.0、CCPD、CRPD 和PubTabNet等主流资源,确保了评估结果的广泛性和可靠性,具体测评数据集如下:

备注:本次测评均使用OCR工具自身提供的预训练模型进行测试,测试均采用工具的示例中提供的参数设置。除开源工具以外,选取百度OCR云服务测试结果作为参照。

字符识别准确率(Precision):正确识别的字符数/识别输出总字符数

字符识别召回率(Recall):正确识别的字符数/验证集总字符数

字符识别综合评分(F-Score):2*Precision*Recall/(Precision+Recal)

平均响应时间:基准样本识别总时间/样本数量。

测评结果

印刷中文的综合测评结果为:

印刷中文的综合评分前三分别是RapidOCR、RagFlow和Surya。

印刷英文的综合测评结果为:

印刷英文综合前三分别是Surya、Unstructured和读光OCR,还是国外开源软件领先。

由于篇幅所限,部分内容未能详尽展开,下载完整报告以获得更全面的测评信息。

相关推荐

盘点六款刷花呗的app(大合集)
365娱乐场投注

盘点六款刷花呗的app(大合集)

📅 06-27 👁️ 9605
冰是透明的,为什么雪却是白色的?
365娱乐场投注

冰是透明的,为什么雪却是白色的?

📅 06-27 👁️ 1081
100幅国画猫,太全了~(附教程)
天天365彩票软件官方下载3D

100幅国画猫,太全了~(附教程)

📅 06-27 👁️ 887
《DNF》搬砖地图推荐
365娱乐场投注

《DNF》搬砖地图推荐

📅 06-27 👁️ 2098
详细步骤教你如何顺利登录小米账号
365bet在线官网

详细步骤教你如何顺利登录小米账号

📅 06-27 👁️ 1679
荒漠屠夫克制关系
天天365彩票软件官方下载3D

荒漠屠夫克制关系

📅 06-27 👁️ 8319