ISO 42001：推进负责任 AI —— 新的基础全球标准

亚马逊云科技 2024-01-23

237

「关注」并「星标」我们，

每天接收关于亚马逊云科技的最新资讯！

人工智能（AI）是我们这一代出现的最具变革性的技术之一，它为成为向善的力量并推动经济增长提供了机会。拥有数千亿个参数的大型语言模型（LLM）的发展解锁了新的生成式 AI 用例，以改善客户体验、提高员工工作效率等等。在亚马逊云科技，我们始终致力于以负责任的方式利用 AI，与客户携手开发和使用 AI 系统，并将安全性、公平性和保密性放在首位。

随着 ISO 42001 的发布，AI 行业达到了一个重要的里程碑。简而言之，ISO 42001 是一项国际管理体系标准，为组织内部的 AI 系统管理提供了指导方针。它为组织建立了一个框架，以便系统性地应对和控制与开发和部署 AI 有关的风险。ISO 42001 强调对负责任的 AI 实践的承诺，鼓励各组织针对其 AI 系统采取特定的控制措施，促进全球互操作性，并为负责任 AI 的开发和部署奠定基础。

对 AI 的信任至关重要，而整合 ISO 42001 等促进 AI 治理的标准，是通过支持负责任的使用方法来赢得公众信任的一种方式。

作为广泛的国际主题专家社区的一部分，亚马逊云科技自 2021 年以来一直积极参与 ISO 42001 的开发，并为该标准的最终发布奠定基础。

国际标准促进了在开发和实施负责任的 AI 解决方案方面的全球合作。也许与以往的任何其他技术不同，应对这些挑战需要科技公司、政策制定者、社区团体、科学家和其他各方的合作和真正的多学科努力，而国际标准可以发挥重要作用。

国际标准是帮助各组织将国内监管要求转化为合规机制（包括工程实践）的重要工具，这些机制在很大程度上具有全球互操作性。有效的标准有助于减少人们对什么是 AI 以及负责任的 AI 涉及哪些内容的困惑，并有助于行业专注于减少潜在危害。亚马逊云科技正与不同的国际利益相关者合作，以改善有关各种主题的新兴 AI 标准，包括风险管理、数据质量、偏见和透明度。

遵守新的 ISO 42001 标准是组织表现出追求卓越的决心，以便负责任地开发和部署 AI 系统和应用的途径之一。我们将继续推动 ISO 42001 标准的采用，并期待与客户合作，共同实现这一目标。

我们致力于为负责任的 AI 的未来投资，并帮助制定国际标准，以维护我们的客户以及我们共同生活和在其中运营的社区的利益。

亚马逊云科技在标准和技术领域持续投入研发资源，在 re:Invent 2023上，我们基于 Amazon Bedrock 发布了一系列防护机制防护机制（含预览版），可以根据您的应用程序要求和负责任的 AI 策略实施定制的防护措施。

作为负责任的 AI 战略的一部分，您现在可以使用 Guardrails for Amazon Bedrock（预览版），通过实施针对您的用例和负责任的 AI 政策定制的保障措施，促进用户与您的生成式 AI 应用程序之间的安全交互。

亚马逊云科技致力于以负责任的、以人为本的方式开发生成式 AI ，注重教育和科学，帮助开发人员在整个 AI 生命周期中整合负责任的 AI。有了适用于 Amazon Bedrock 的 Guardrails，您可以始终如一地实施保障措施，以提供符合公司政策和原则的相关、安全的用户体验。Guardrails 可帮助您定义拒绝主题和内容过滤器，以从用户与应用程序之间的交互中删除不良和有害内容。这为基础模型（FM）中内置的任何保护措施提供了额外的控制级别。

为您的所有应用程序提供一致的

AI 安全级别

用于 Amazon Bedrock 的 Guardrails 可根据用例特定策略评估用户输入和 AI 响应，并提供额外的保护层，而不受底层 AI 的影响。Guardrails 可应用于各种 FM，包括 Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic 和 Amazon Titan Text，以及微调模型。客户可以创建多个护栏，每个护栏配置不同的控制组合，并在不同的应用和用例中使用这些护栏。Guardrails 还可以与亚马逊 Bedrock 的代理集成，以构建与您的负责任 AI 政策相一致的生成式 AI 应用。

阻止生成式 AI 应用程序中的不良主题

企业认识到需要管理生成式 AI 应用中的交互，以获得相关且安全的用户体验。他们希望进一步自定义交互，使其保持在与其业务相关的主题上，并与公司政策保持一致。使用简短的自然语言描述，Guardrails for Amazon Bedrock 可让您在应用程序的上下文中定义一组要避免的主题。Guardrails 会检测并阻止属于受限主题的用户输入和调频响应。例如，金融助手可以避免与投资建议相关的主题。

根据负责任的 AI 政策过滤有害内容

Guardrails for Amazon Bedrock 提供可配置阈值的内容过滤器，可过滤仇恨、侮辱、性和暴力类别的有害内容。大多数 FM 已经提供了内置保护，以防止生成有害响应。除这些保护措施外，Guardrails 还允许您配置不同类别的阈值，以过滤有害的交互。Guardrails 可自动评估用户查询和 FM 响应，以检测并帮助防止属于受限类别的内容。例如，电子商务网站可以设计其在线助手，避免使用仇恨言论或侮辱等不当语言。

响应 PII 以保护用户隐私（即将推出）