
在今年的OCW大会上,Oracle机器学习和AI产品部高级总监Mark Hornick和数据、In-Memory、AI技术副总裁Shasank Chavan介绍了如何从Oracle Database 23ai众多AI功能中为不同的业务场景选择合适的技术。

因此,Oracle Database 23ai 引入了强大的向量搜索技术,彻底改变了企业处理非结构化数据的方式。随着越来越多的数据以文档、图像和视频的形式出现,捕捉其语义特征变得至关重要。Oracle Database 23ai的AI 向量搜索功能正是为此而设计的。
向量搜索超越了传统的精确匹配,它通过测量数据之间的相似性来捕捉数据的语义特征。这意味着用户不仅可以找到精确的匹配项,还可以发现与查询相关的内容。通过 SQL 查询或自然语言输入,企业可以立即找到与业务相关的内容。
但Oracle Database 23ai更进一步。它的向量搜索与生成式 AI 无缝结合,创建了一个强大的管道。从数据嵌入和索引构建到语义查询,整个过程都是自动化的。这使企业能够利用生成式 AI 的力量,不仅快速获得精确的结果,而且还能自动生成个性化的文本和决策建议。


基于客户购买历史的推荐:利用传统的机器学习算法(如分类算法),企业可以根据客户过去的购买行为预测他们未来可能感兴趣的产品。通过分析历史数据,系统可以生成个性化的推荐列表。
基于产品图像或描述的推荐:通过向量搜索技术,Oracle Database 23ai能够分析产品的图像或描述信息,进行语义匹配,从而推荐相似的产品。这对电商平台尤为有用,客户可以上传一张产品图片,系统即可推荐相似款式。
生成式AI的应用:结合生成式AI,企业可以通过自然语言描述生成推荐内容。例如,客户询问某类产品的建议,系统可以实时生成个性化的产品推荐清单。
基于关联规则的推荐(Market Basket Analysis):通过分析客户的购买组合,Oracle Database 23ai 可以发现哪些产品经常被一起购买,并基于这些关联规则做出推荐。这种方法特别适用于零售和电商场景,帮助企业发现隐藏的购买模式。
二元分类(Binary Classification):用于预测客户是否会购买某个产品。这种分类算法根据客户的历史行为、人口统计数据等特征,预测他们在未来购买或不购买某个产品的可能性。常见的应用场景包括预测某客户是否会购买特定商品、订阅服务或进行续购。
多类别分类(Multiclass Classification):用于预测客户最有可能购买的具体产品。在这种分类中,算法会基于客户的购买历史、偏好和其他相关数据,预测客户在多个产品中的选择。例如,汽车销售商可以通过多类别分类预测客户最有可能购买的汽车类型或型号。
通过历史数据在数据库内构建分类模型,并使用简单的SQL语句预测潜在客户的购买概率是Oracle Database 23ai的一个强大功能。这个过程可以在数据库内部完成,无需将数据导出到外部平台,从而保证数据的安全性和处理效率。
首先,利用Oracle Database 23ai的内嵌机器学习算法(如支持向量机SVM、决策树等),可以根据客户的历史数据(如收入、年龄、购买记录等)构建分类模型。模型通过分析这些历史数据,学习客户购买行为的模式。
一旦模型建立好,您可以通过简单的SQL查询,预测潜在客户购买某产品的概率。例如,使用PREDICTION_PROBABILITY函数,查询客户购买某产品的可能性。这个查询将返回每个客户的购买概率,帮助企业做出更明智的营销决策,精准锁定潜在客户,从而提升转化率。


一旦表中的图像有了对应的向量,您可以使用AI向量搜索功能,查找与输入图像在语义上相似的房屋。在Oracle Database 23ai中还可以使用SQL语句将AI向量搜索与业务数据(关系型数据)相结合,例如客户的预算和位置偏好,以进一步细化搜索结果。这种方法通过结合AI向量搜索和客户的具体业务需求,提供个性化的搜索结果,大大提升了客户体验和业务效率。


1. 基于关键词和语义的文档搜索
通过关键词搜索,系统可以快速找到包含特定关键词的文档内容;而通过语义搜索,系统能够理解用户查询的意图,并返回与查询语义上相关的文档。这种混合搜索方式结合了传统的文本搜索和AI驱动的向量搜索技术,确保更高的搜索精度和相关性。例如,用户可以输入“为什么我的电视屏幕闪烁?”这样的问题,系统会基于语义搜索,找出相关文档并提供解答,而不仅仅是简单匹配“电视”和“屏幕”这类关键词。
2. 使用生成式AI处理特定文档
在第二种场景下,Oracle Database 23ai结合了生成式AI技术,使得企业可以根据自身的特定文档,生成内容或提供自动化的文档总结、解释等服务。通过生成式AI,用户可以基于自然语言输入快速获得与其企业文档相关的个性化内容。例如,企业可以让生成式AI根据合同或技术文档生成总结或建议,提升文档处理的效率和智能化水平。
这两种文档搜索方式能够帮助企业在处理大量非结构化数据时,快速获取所需信息,并通过AI技术提升文档处理的智能化和自动化程度。
AI的引入彻底改变了文档搜索的方式,如下图所示向量化文档搜索流程。向量化文档搜索流程利用AI实现了大规模文档检索的效率和准确性。传统搜索方法依赖于关键词匹配,这在处理大量文档时可能很慢且不准确。向量化文档搜索流程的关键优势在于其与 LLM 生成式AI的集成,使用AI,我们可以捕捉文档的语义,这意味着我们可以理解它们的意图和上下文。这种方法极大地提高了搜索速度,同时确保了复杂查询的高精度匹配。



考虑一种场景:聊天机器人帮助客户寻找产品信息。凭借向量搜索功能,它可以快速扫描大量文档,并根据客户的查询从结构化数据中提取相关详细信息。此外,它可以利用企业知识库来提供深入见解,例如推荐补充产品或服务。
Oracle Database 23ai中的LLM还使聊天机器人能够随着时间的推移进行学习和适应。它们可以从与用户的互动中进行调整,提供越来越准确和相关的响应。这种自适应能力确保了聊天机器人的长期价值,因为它们可以随着企业的发展和变化而发展和变化。
通过Oracle Database 23ai,企业可以利用生成式AI(GenAI)和检索增强生成(RAG)技术,为用户提供实时且上下文相关的答案,从而大大提升业务效率,提高客户参与度、改善客户服务并增强整体客户体验。通过利用 Oracle Database 的AI功能,企业可以构建智能且直观的聊天机器人,为客户带来真正个性化的互动。

核心功能与优势:
多途径解决业务难题: 提供多种方法来应对常见的业务问题,满足不同场景的需求。
传统机器学习与数据库深度融合:将传统的机器学习算法与数据库内的数据进行结合,实现企业级数据的智能分析。
关键词与语义搜索:不仅能通过关键词精确查找文档,还能根据文档的语义内容进行更深入的搜索。
SQL调用生成式AI:通过简单的SQL语句即可调用生成式AI,实现文本生成、代码生成等多种功能。
即将推出的更多AI功能:Oracle Database 23ai将带来更多先进的AI功能,为企业提供更强大的数据分析和智能决策能力。





