暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

实现数据和内容合规性的图像分析 OCR

Azure云科技 2024-04-10
257


在当今数字化环境下,企业面临着多种挑战,担负着为用户、员工以及合作伙伴提供一个安全可靠的网络环境的责任。随着各种社交媒体和通讯渠道上共享的图片和视频数量的不断增加,企业有必要采取强有力措施来确保数据和内容的安全及合规。

光学字符识别(OCR)技术可从图片和扫描文件中提取文本,并将其转变成机器可读的格式。这样计算机就可以读取图片中的文本内容,并确定文本在图片中的位置。




OCR 识别图片中的文本


随着大语言模型(LLM)的多模态功能不断增强,从图像中提取文本变得越发重要。企业必须确保提取的图像内容既无害又合规。

使用 OCR 从图像中提取文本,有助于识别包含有害内容(如粗俗用语和仇恨言论)的图像。OCR 提取的文本被传递给内容审核系统,用于对含有有害文本的图像进行分类和过滤。内容审核流程可以是自定义的,也可以利用 Azure AI 内容安全(Azure AI Content Safety)提供的文本和多模态内容审核 API 来快速高效地检测文本和图像中的不当的内容。



OCR检测出图片中含有有害文本


审核策略和机制应该根据企业的特定目标和用户需求量身定制。一些企业将图像上传到像 GPT-4V turbo with vision 这样的大语言模型 API 之前,会使用 OCR 来审核图像中的内容。从图像中提取的文本经过内部审核系统处理后,被按照不同安全等级进行分类,这样可以防止不当的恶意文本输入大语言模型,既优化了大语言模型API的输出,也避免了大语言模型被潜在恶意用户行为影响。




图像分析 OCR 在预防数据丢失和确保数据合规上的应用


OCR 还可以识别和保护图像中的敏感信息。例如可以利用 OCR 来检测图像中包含的健康记录、财务信息以及个人身份信息(PII),如姓名、社保号码和地址等私人数据。

OCR 从图像中提取文本后,将文本传递给敏感数据检测器(如 Azure AI PII 检测器),检测器会识别文本中存在的敏感信息并对其进行分类,然后对敏感信息进行编辑或屏蔽来防止未经授权的访问或共享。您可以参考代码示例了解如何使用 Azure AI OCR 和 PII 检测器对敏感信息进行检测。




OCR识别身份证信息


图像中有些敏感数据很容易被忽视,这时利用光学字符识别技术检测图像中的敏感数据,可确保在处理私人信息时遵守隐私法和行业标准。这样不仅有助于企业与用户和客户建立信任,还能降低违规风险。




 高级架构图



 客户案例 



Microsoft Purview 通信合规(Microsoft Purview Communication Compliance)运用 Azure AI 图像分析 OCR 从 Teams 聊天记录或 Exchange online 电子邮件的共享图像中提取文本,然后将文本按照合规流程进行处理。该流程将不恰当内容和敏感信息反馈给合规性管理员,以便其采取进一步措施。在这之前,包含在图片中风险内容是无法被检测到的,属于合规性管理员的盲点。



Microsoft 新闻(Microsoft News)还利用 Azure AI 图像分析 OCR 来确保文章中的图像不含任何不当内容。




Azure AI 服务视觉 OCR 模型入门


如何使用 Azure AI OCR 审核内容并保护图像中包含的敏感文本信息?您可以参照代码示例或阅读快速入门指南。此外,您还可以使用 Vision Studio 进行无代码的试用体验。如果您对 OCR 感兴趣,您也可以浏览 Azure AI 文档智能网页了解更多相关内容。

⇲ 代码示例

https://github.com/Azure-Samples/cognitive-services-python-sdk-samples/blob/master/samples/vision/ocr-data-safety/OCR for data safety and content safety.ipynb


⇲ 快速入门指南

https://learn.microsoft.com/en-us/azure/ai-services/computer-vision/concept-ocr

⇲ Vision Studio

https://portal.vision.cognitive.azure.com/gallery/ocr


⇲ Azure AI 文档智能

https://learn.microsoft.com/en-us/azure/ai-services/document-intelligence/overview?view=doc-intel-4.0.0#document-analysis-models



文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论