暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

ISO 42001:推进负责任 AI —— 新的基础全球标准

亚马逊云科技 2024-01-23
237

「关注」「星标」我们,

每天接收关于亚马逊云科技的最新资讯


人工智能(AI)是我们这一代出现的最具变革性的技术之一,它为成为向善的力量并推动经济增长提供了机会。拥有数千亿个参数的大型语言模型(LLM)的发展解锁了新的生成式 AI 用例,以改善客户体验、提高员工工作效率等等。在亚马逊云科技,我们始终致力于以负责任的方式利用 AI,与客户携手开发和使用 AI 系统,并将安全性、公平性和保密性放在首位。



随着 ISO 42001 的发布,AI 行业达到了一个重要的里程碑。简而言之,ISO 42001 是一项国际管理体系标准,为组织内部的 AI 系统管理提供了指导方针。它为组织建立了一个框架,以便系统性地应对和控制与开发和部署 AI 有关的风险。ISO 42001 强调对负责任的 AI 实践的承诺,鼓励各组织针对其 AI 系统采取特定的控制措施,促进全球互操作性,并为负责任 AI 的开发和部署奠定基础。


对 AI 的信任至关重要,而整合 ISO 42001 等促进 AI 治理的标准,是通过支持负责任的使用方法来赢得公众信任的一种方式。



作为广泛的国际主题专家社区的一部分,亚马逊云科技自 2021 年以来一直积极参与 ISO 42001 的开发,并为该标准的最终发布奠定基础。


国际标准促进了在开发和实施负责任的 AI 解决方案方面的全球合作。也许与以往的任何其他技术不同,应对这些挑战需要科技公司、政策制定者、社区团体、科学家和其他各方的合作和真正的多学科努力,而国际标准可以发挥重要作用。


国际标准是帮助各组织将国内监管要求转化为合规机制(包括工程实践)的重要工具,这些机制在很大程度上具有全球互操作性。有效的标准有助于减少人们对什么是 AI 以及负责任的 AI 涉及哪些内容的困惑,并有助于行业专注于减少潜在危害。亚马逊云科技正与不同的国际利益相关者合作,以改善有关各种主题的新兴 AI 标准,包括风险管理、数据质量、偏见和透明度。


遵守新的 ISO 42001 标准是组织表现出追求卓越的决心,以便负责任地开发和部署 AI 系统和应用的途径之一。我们将继续推动 ISO 42001 标准的采用,并期待与客户合作,共同实现这一目标。


我们致力于为负责任的 AI 的未来投资,并帮助制定国际标准,以维护我们的客户以及我们共同生活和在其中运营的社区的利益。


亚马逊云科技在标准和技术领域持续投入研发资源,在 re:Invent 2023上,我们基于 Amazon Bedrock 发布了一系列防护机制防护机制(含预览版),可以根据您的应用程序要求和负责任的 AI 策略实施定制的防护措施。



作为负责任的 AI 战略的一部分,您现在可以使用 Guardrails for Amazon Bedrock(预览版),通过实施针对您的用例和负责任的 AI 政策定制的保障措施,促进用户与您的生成式 AI 应用程序之间的安全交互。


亚马逊云科技致力于以负责任的、以人为本的方式开发生成式 AI ,注重教育和科学,帮助开发人员在整个 AI 生命周期中整合负责任的 AI。有了适用于 Amazon Bedrock 的 Guardrails,您可以始终如一地实施保障措施,以提供符合公司政策和原则的相关、安全的用户体验。Guardrails 可帮助您定义拒绝主题和内容过滤器,以从用户与应用程序之间的交互中删除不良和有害内容。这为基础模型(FM)中内置的任何保护措施提供了额外的控制级别。


为您的所有应用程序提供一致的

AI 安全级别


用于 Amazon Bedrock 的 Guardrails 可根据用例特定策略评估用户输入和 AI 响应,并提供额外的保护层,而不受底层 AI 的影响。Guardrails 可应用于各种 FM,包括 Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic 和 Amazon Titan Text,以及微调模型。客户可以创建多个护栏,每个护栏配置不同的控制组合,并在不同的应用和用例中使用这些护栏。Guardrails 还可以与亚马逊 Bedrock 的代理集成,以构建与您的负责任 AI 政策相一致的生成式 AI 应用。


阻止生成式 AI 应用程序中的不良主题


企业认识到需要管理生成式 AI 应用中的交互,以获得相关且安全的用户体验。他们希望进一步自定义交互,使其保持在与其业务相关的主题上,并与公司政策保持一致。使用简短的自然语言描述,Guardrails for Amazon Bedrock 可让您在应用程序的上下文中定义一组要避免的主题。Guardrails 会检测并阻止属于受限主题的用户输入和调频响应。例如,金融助手可以避免与投资建议相关的主题。


根据负责任的 AI 政策过滤有害内容


Guardrails for Amazon Bedrock 提供可配置阈值的内容过滤器,可过滤仇恨、侮辱、性和暴力类别的有害内容。大多数 FM 已经提供了内置保护,以防止生成有害响应。除这些保护措施外,Guardrails 还允许您配置不同类别的阈值,以过滤有害的交互。Guardrails 可自动评估用户查询和 FM 响应,以检测并帮助防止属于受限类别的内容。例如,电子商务网站可以设计其在线助手,避免使用仇恨言论或侮辱等不当语言。


响应 PII 以保护用户隐私(即将推出)


Guardrails for Amazon Bedrock 可让您检测用户输入和 FM 响应中的个人身份信息 (PII)。根据使用案例,您可以选择性地拒绝包含 PII 的输入,或在调频响应中编辑 PII。例如,在从呼叫中心的客户和座席对话记录生成摘要时,您可以编辑用户的个人信息。


扫描下方二维码更多延展内容



星标不迷路,优先获得云科技资讯!

关注后记得星标「亚马逊云科技」


马上点击“阅读原文”

探索更多云计算未来创想

让我们共同见证亚马逊的一小步

云计算的一大步


文章转载自亚马逊云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论