暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【AI人工智能系列】7.juptyter在线编程实战【ORC图片文字识别应用】

284

    OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

下边以百度飞浆为平台,juptyter为呈现来演示如何在线开发一个简易的图片文字识别应用。可在该应用的基础上进行扩展、封装成各业务场景的识别应用,例如:身份证号码、发票、车牌号、等业务场景:


1、打开登录页面

http://nangs.vip:5555/login

2、输入密码

3、新建代码文件

4、输入代码块

    from paddleocr import PaddleOCR, draw_ocr


    # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
    # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
    ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
    img_path = './baidu.jpg'
    result = ocr.ocr(img_path, cls=True)
    for line in result:
    print(line)




    5、点击运行按钮


    点击运行后,输出运行的结果


    6、输出结果


    对比识别结果与图片文字的效果


    写在最后:

    学习完本套课程,您将能单独完成OCR文字识别、人脸识别等人工智能技术。结合实际业务需求,可做出各类场景产品


    文章转载自小南瓜开发平台,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论