2023年10月2日,Cloudflare 公司推出了一个新平台,配备大规模高性能、新的向量数据库和可观测性功能,使开发人员能够在 Cloudflare 网络上构建全栈 AI 应用程序。该解决方案被称为“Workers AI”,可提供快速且经济实惠的推理,无需管理基础设施,从而提高生产就绪、快速且安全的应用程序的生产效率。
虽然每家公司都希望采用和构建人工智能应用程序,但说起来容易做起来难。人工智能的开发和部署除了其复杂性和高要求之外,还需要大量的财务投资。
Cloudflare 表示,尽管开发人员渴望在这一领域进行创新,但企业领导者却致力于优化成本、工具和人员配置。
Cloudflare开发者平台为开发团队提供了交付无缝、安全的应用程序所需的一切,并由 Cloudflare 无限可扩展的全球网络提供支持。该平台通过三个新解决方案得到进一步扩展:Workers AI、Vectorize 和 AI Gateway。
Cloudflare 首席执行官 Matthew Prince 表示,Workers AI 的创建是为了“为开发人员提供构建应用程序所需的所有工具”。“Workers AI 帮助开发人员在无服务器 GPU 上运行众所周知的 AI 模型,所有这些都在 Cloudflare 值得信赖的全球网络上进行。它与我们的开发者平台无缝集成,但为了使其真正易于访问,我们使其与平台无关,因此它也可以通过 REST API 提供在其他任何地方。”
通过提供对在 Cloudflare 超分布式边缘网络上运行的 GPU 的访问,开发人员可以放心,因为 AI 推理正在尽可能靠近用户进行,从而推动低延迟的最终用户体验。
此外,Workers AI 可确保数据保留在其所在区域内,从而使用户能够遵守潜在的合规性和监管要求。Cloudflare 的隐私优先方法进一步推动了合规性,保证用于干扰的数据不会被释放用于培训。
Cloudflare 推出了新的矢量数据库 Vectorize,允许开发人员完全在 Cloudflare 上构建全栈 AI 应用程序。
“当开发人员将人工智能应用到新的和现有的应用程序中时,矢量数据库是一个关键的构建块,特别是对于生成人工智能、语义搜索和推荐用例(仅举几例)。如果没有矢量数据库,就很难将许多此类用例扩展到‘生产’,”Prince 说。“能够进行实验和原型设计是一回事,但我们认为我们的一个差异化因素是使开发人员能够扩展到生产(Workers 本身的核心原则之一)。”
Vectorize 受益于 Cloudflare 的全球网络、转发低延迟和推理时间。它与更广泛的人工智能生态系统集成,使用户能够存储使用 OpenAI 和 Cohere 生成的嵌入。
与 Workers AI 配合使用,Vectorize 使开发人员能够在单一平台内为支持 AI 的应用程序提供支持,这些应用程序可以负担得起大规模运行的费用。
最后,Cloudflare 推出了 Gateway AI,这是一种确保基于 Cloudflare 构建的 AI 应用程序可靠、可观察和可扩展的方法。GatewayAI 通过提供人工智能流量的可见性,包括请求数量、用户数量、运行应用程序的成本和请求持续时间等变量,消除了人工智能应用程序开发的神秘面纱。
缓存和速率限制还使开发人员能够减轻不断增长的成本,减少对重复查询的 API 的调用,并帮助管理恶意行为者和大量流量。
“Cloudflare 的 AI 公告使希望推出下一代应用程序的开发人员更容易获得高性能且可扩展的 AI 技术,”Prince 解释道。“我们能够将这项技术添加到我们现有的网络中,使我们能够利用现有的基础设施并提供更好的性能和更好的成本。我们是这种规模水平上唯一一家允许开发者和公司只为他们使用的计算付费的提供商,这将为许多以前被排除在人工智能竞赛之外的新开发者和组织打开大门。”
文章来源:https://www.dbta.com/Editorial/News-Flashes/Cloudflare-Accelerates-AI-App-Development-with-Global-Infinitely-Scalable-Network-160800.aspx




