OCI Vision是一个无服务器的云原生服务,通过REST API提供基于深度学习的、预构建的和定制的计算机视觉模型。OCI Vision帮助您识别和定位对象,提取文本,并从业务文档(如收据)中识别表、文档类型和键值对。使用OCI Vision的预构建或自定义特性不需要任何数据科学经验。
您可以通过Oracle Cloud Console、Python和Java语言的SDK
(OCI Software Developer Kits)或OCI CLI访问该服务。
在analyzeImage API中提供的图像分析模型可以帮助您识别图像,它们可能是街道、零售商品、汽车、公寓、服装、牛仔裤等。

图像分类

对象检测
图像分析包括以下主要功能:
图像分类:根据整体场景为图像分配标签,如天空、大山、河流等。
对象检测:定位和识别图像中的对象,如公共汽车、盒子或人。
文本识别和OCR:定位并将图像中的文本信息数字化,例如停车标志中的“停止”或牌照中的“XY3497”。
所有图像分析的API都支持异步和批处理。
文档AI可以帮助您理解基于文档的图像,如收据、发票和合同。

文档AI包括以下主要功能:
文本识别和OCR:在字或行水平上定位和数字化图像中的文本信息。
Key-value提取:从收据中提取预定义的Key-value对信息列表,例如字段标签:“TransactionDate”和字段值:“01/11/2022”。
表格抽取:以表格形式提取内容,保持单元格的行/列关系,如Cell文本:" 2,098,221 " ,行索引:14,列索引: 2。
文档分类:根据文档的外观、高级特征以及提取的关键字(发票、收据、简历等)对文档进行分类。
所有文档人工智能API都支持异步和批量处理。
OCI Vision提供开箱即用的AI模型,既是用户没有数据科学专业知识,也可以很容易地使用OCI Vision完成他们的行业的图像处理的业务场景。
OCI Vision还支持创建自定义的图像分类和对象检测模型,这些自定义模型培训模型都可以通过OCI Vision进行管理的。
使用OCI Vision来训练自定义模型,从标记好的数据集开始。你可以用OCI数据标签服务很容易地给原始图像打标签。

在您选择模型类型和数据集之后,为您的模型命名并选择一个训练持续时间。默认值为“推荐”。

在您开始训练一个新模型之后,模型训练进度、日志和最终的质量度量在Model Details页面上都是可用的。您还可以使用“Analyze”选项在新图像上测试新训练的模型。

可以广泛应用于许多垂直行业,包括金融服务、制造、运输和零售。
自动化后台任务:对文档进行分类,检测表,并从文档(如收据)中提取所需信息,使业务工作流自动化,如员工费用报销流程。
数字资产管理:使用元数据(包括文档类型、文本和对象)丰富基于图像的文件,以便在数字资产管理系统或更大的数据仓库中进行更好的索引和检索。
检测视觉异常:根据视觉外观(如变色、撕裂、生锈、变形或破损)将产品或设备分类为标准或缺陷。自动检测有缺陷的材料,以标记是否需要维修。
图像分析功能支持JPG和PNG文件。
文档AI支持JPG、PNG、PDF和TIFF文件。

作者简介
李永锋,甲骨文云服务专家团队资深咨询顾问,专注于云服务基础设施的应用架构解决方案。具有20+年的金融、制造、电商等行业的企业IT架构咨询及相关技术解决方案经验。您可以通过yongfeng.li@oracle.com联系他。




