【AI人工智能系列】7.juptyter在线编程实战【ORC图片文字识别应用】

小南瓜开发平台 2023-05-27

320

OCR（optical character recognition）文字识别是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

下边以百度飞浆为平台，juptyter为呈现来演示如何在线开发一个简易的图片文字识别应用。可在该应用的基础上进行扩展、封装成各业务场景的识别应用，例如：身份证号码、发票、车牌号、等业务场景：

1、打开登录页面

http://nangs.vip:5555/login

2、输入密码

3、新建代码文件

4、输入代码块

from paddleocr import PaddleOCR, draw_ocr


# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = './baidu.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
    print(line)

5、点击运行按钮

点击运行后，输出运行的结果

6、输出结果

对比识别结果与图片文字的效果

写在最后：

学习完本套课程，您将能单独完成OCR文字识别、人脸识别等人工智能技术。结合实际业务需求，可做出各类场景产品

人工智能 ocr 文字识别文字图片软件

文章转载自小南瓜开发平台，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。