Oracle首席企业架构师(Chief Corporate Architect),Edward Screven今天为观众介绍了如何利用HeatWave来构建生成式AI的应用。

HeatWave是一个快速发展的数据库相关技术,过去从MySQL开始提供了OLTP能力,到后来的OLAP的分析能力;2022年增加了AutoML技术,允许用户利用AutoML自动化构建机器学习模型,包括使用聚类、分类和推荐等能力;2023年又推出了Lakehouse,用户不需要将数据装载到数据库中,而是直接从对象存储中查询和读取数据。而就在今年7月,我们推出了生成式AI的能力,可以利用自然语言来进行相关操作。

HeatWave生成式AI是集成的、自动化的且安全的。您不需要AI专家,并且不需要做数据迁移。内置了向量数据库以及大语言模型,客户可以选择数据库外的大语言模型,但是很多客户都选择了使用数据库内置的大语言模型,我们也给您提供了聊天工具,方便您使用对话的方式来和Heatwave交互。

使用非Oracle数据库构建生成式AI是复杂的,我们看到创建向量数据和使用大语言模型来利用向量数据都包含很多的步骤。重要的是花费了大量时间来构建这些应用。

而在HeatWave里,如上图所示,如果你想创建向量存储,只需使用一句Heatwave SQL语句即可;同样使用大语言模型也只需要一句SQL语句。
Edward Screven随后介绍了两个案例,其中一个是SOCOBOX的使用场景。

SOCOBOX采用两种方式使用HeatWave。 第一种方式是他们帮助他们的客户打造聊天机器人(ChatBox)。他们帮助客户利用HeatWave的生成式AI能力打造聊天机器人:很多客户的数据都存在数据库中,比如提供产品介绍,财务表现等等,利用向量化数据并存储到数据库中,可以进行语义检索并为客户生成相应内容。另外一个方式是使用了AutoML来做异常检测等功能。传统方式都是利用查看日志,分析然后发现问题,但这是非常耗时的。所以他们结合了AutoML能力和生成式AI的能力,来做更好的分析检测和问题定位。

我们可以非常方便的扩展向量数据的能力,并且支持多种文档。上图展示了相应的扩展能力:比如处理2.23亿segment的向量,只需要1.7小时就可以产生6.8M的HTML文件,大约每秒处理35000个segment。如果你觉得这个还不够快,那么你可以继续扩展更多的节点。

HeatWave自动化了向量存储的创建,这是个独特的能力。通过对比Snowflack, Databricks 以及BigQuery这些产品,我们可以看到只有HeatWave自动化了向量存储的创建全过程。
随后Edward Screven还请来了SmarterD的联合创始人和CEO Vijay Sundhar先生介绍了利用HeatWave简化了他们创建相关应用的过程。

随后Edward Screven介绍了多云的选项,客户往往会选择几朵云,客户可以在AWS, Azure上使用HeatWave,也可以在OCI的专有区域以及Alloy上使用HeatWave。HeatWave在所有这些部署方式上都可以使用。同时作为对比,在向量创建上HeatWave要比AWS的 Knowledge Bases for Bedrock快30倍,价格只有其三分之一。

我们也增加了非常重要的功能,查询结果也可以直接写入到对象存储。这意味着HeatWave变成了一个非常高效的数据转换工具。目前支持广泛的语言选择,包括英文、中文、阿拉伯语等等。HeatWave提供了统一的安全控制和配置方式,数据都保存在同一个数据库系统中,所有的通信都是授权且加密的。

然后Edward Screven使用数据转换做了一个对比。他提到用传统方式做数据转换往往会用到MapReduce等工具,但是都相对较为复杂。你需要手工构建集群,完成复杂的配置,并且往往没有内置的ACID的保证,同时使用非SQL语言表示数据处理逻辑较复杂。而使用HeatWave这些问题都变得简单:HeatWave提供从使用SQL操作数据,自动优化配置到内置的ACID合规性等使您可以聚焦在业务问题本身。

“在我们利用 GenAI 和机器学习能力的战略中,HeatWave 发挥了重要作用。能力的战略发挥了重要作用。用于数据预测分析的 AutoML、数据库内的 LLM、数据库内的矢量存储以及 HeatWave 中的 RAG 都是我们在企业数据中轻松采用生成式人工智能的基石。
通过将所有功能整合到单一数据平台服务中,我们可以比其他解决方案更简单、更快速地实现这一目标。我们期待在 HeatWave GenAI 、 Lakehouse 和 AutoML 的支持下,改善 Toks 的客户体验。”
– Toks IT Director David Leo

编辑:殷海英




