暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Oracle CloudWorld 2024: 从Oracle Database 23ai 中为业务选择合适的AI功能

甲骨文云技术 2024-09-25
401

在今年的OCW大会上,Oracle机器学习和AI产品部高级总监Mark Hornick和数据、In-Memory、AI技术副总裁Shasank Chavan介绍了如何从Oracle Database 23ai众多AI功能中为不同的业务场景选择合适的技术。

从 9i 版本开始,Oracle Database 就为用户提供内置的机器学习功能,帮助企业高效地对业务数据进行预测分析。Oracle Database 内置的 AutoML 功能可以自动完成数据准备、特征工程、模型选择和超参数调整,大大简化了数据科学家的工作。通过在 Oracle 数据库内部使用声明性 SQL 或利用 R 和 Python 集成,企业可以直接在业务数据上运行数据库内的机器学习算法。这种方法不仅速度更快,而且更安全,无需将数据发送到外部 AI 算法。凭借内置的AI功能,Oracle Database使企业能够在不牺牲数据安全的情况下,高效地利用其业务数据进行预测分析和决策。
Oracle Database 23ai 机器学习功能更加强大,提供了超过30种内置的先进机器学习算法。这些算法包括强大的决策树、逻辑回归和支持向量机(SVM),客户能够构建复杂且准确的分类、回归和时间序列模型。

通过 Oracle Database 23ai,客户可以充分利用自己企业的数据。这些算法速度快、效率高,可以在企业自己的数据上进行快速训练和预测。无论企业是想要预测客户行为、优化供应链还是分析时间序列数据,Oracle Database 23ai都为企业提供了所需的工具。Oracle Database 23ai消除了数据科学家和分析师在构建机器学习解决方案时面临的许多障碍。有了这些内置的算法和功能,企业可以专注于利用数据,而不是花费大量时间和精力在数据准备和算法实现上。
毫无疑问,企业数据正在并且一直发生变化,变得更加多样化和复杂。随着越来越多的非结构化数据涌入,包括文档、图像和视频,捕捉数据的语义变得至关重要。这就是向量发挥作用的地方。向量允许我们在图像中识别对象、在文档中理解语言和主题,甚至可以分析视频中的复杂场景。它们使机器能够理解人类语言,并使我们能够以更智能、更直观的方式与技术交互。

因此,Oracle Database 23ai 引入了强大的向量搜索技术,彻底改变了企业处理非结构化数据的方式。随着越来越多的数据以文档、图像和视频的形式出现,捕捉其语义特征变得至关重要。Oracle Database 23ai的AI 向量搜索功能正是为此而设计的。

向量搜索超越了传统的精确匹配,它通过测量数据之间的相似性来捕捉数据的语义特征。这意味着用户不仅可以找到精确的匹配项,还可以发现与查询相关的内容。通过 SQL 查询或自然语言输入,企业可以立即找到与业务相关的内容。

但Oracle Database 23ai更进一步。它的向量搜索与生成式 AI 无缝结合,创建了一个强大的管道。从数据嵌入和索引构建到语义查询,整个过程都是自动化的。这使企业能够利用生成式 AI 的力量,不仅快速获得精确的结果,而且还能自动生成个性化的文本和决策建议。

那么,我们应该使用哪些AI功能呢?答案依然是:视情况而定。比如在产品推荐的业务场景中,Oracle Database 23ai 提供了多种解决方案,具体选择取决于您的业务需求和数据类型。
如下图中四种对于产品推荐的业务场景:

  1. 基于客户购买历史的推荐:利用传统的机器学习算法(如分类算法),企业可以根据客户过去的购买行为预测他们未来可能感兴趣的产品。通过分析历史数据,系统可以生成个性化的推荐列表。

  2. 基于产品图像或描述的推荐:通过向量搜索技术,Oracle Database 23ai能够分析产品的图像或描述信息,进行语义匹配,从而推荐相似的产品。这对电商平台尤为有用,客户可以上传一张产品图片,系统即可推荐相似款式。

  3. 生成式AI的应用:结合生成式AI,企业可以通过自然语言描述生成推荐内容。例如,客户询问某类产品的建议,系统可以实时生成个性化的产品推荐清单。

  4. 基于关联规则的推荐(Market Basket Analysis):通过分析客户的购买组合,Oracle Database 23ai 可以发现哪些产品经常被一起购买,并基于这些关联规则做出推荐。这种方法特别适用于零售和电商场景,帮助企业发现隐藏的购买模式。

对于业务场景1,我们可在数据库内部构建使用分类算法模型,分类(Classification)是Oracle Database 23ai中的一种核心功能,帮助企业预测客户购买行为。根据业务需求,您可以选择二元分类或多类别分类:
  1. 二元分类(Binary Classification)用于预测客户是否会购买某个产品。这种分类算法根据客户的历史行为、人口统计数据等特征,预测他们在未来购买或不购买某个产品的可能性。常见的应用场景包括预测某客户是否会购买特定商品、订阅服务或进行续购。

  2. 多类别分类(Multiclass Classification):用于预测客户最有可能购买的具体产品。在这种分类中,算法会基于客户的购买历史、偏好和其他相关数据,预测客户在多个产品中的选择。例如,汽车销售商可以通过多类别分类预测客户最有可能购买的汽车类型或型号。

通过历史数据在数据库内构建分类模型,并使用简单的SQL语句预测潜在客户的购买概率是Oracle Database 23ai的一个强大功能。这个过程可以在数据库内部完成,无需将数据导出到外部平台,从而保证数据的安全性和处理效率。

首先,利用Oracle Database 23ai的内嵌机器学习算法(如支持向量机SVM、决策树等),可以根据客户的历史数据(如收入、年龄、购买记录等)构建分类模型。模型通过分析这些历史数据,学习客户购买行为的模式。

一旦模型建立好,您可以通过简单的SQL查询,预测潜在客户购买某产品的概率。例如,使用PREDICTION_PROBABILITY函数,查询客户购买某产品的可能性。这个查询将返回每个客户的购买概率,帮助企业做出更明智的营销决策,精准锁定潜在客户,从而提升转化率。

对于场景3——“基于产品图像或描述的推荐“,在Oracle Database 23ai中,可以使用全新的向量数据类型来存储向量信息,并基于这些向量实现语义相似度搜索。首先,您可以创建一个新的数据库表,用于存储房屋的图像及其对应的向量表示。这个向量是通过机器学习模型生成的,能够捕捉图像的语义特征。接下来,利用AI模型为每个房屋图像生成向量。向量中的每个维度代表房屋的特定特征,如装饰风格、建筑材料等,这些特征由机器学习算法自动提取。

一旦表中的图像有了对应的向量,您可以使用AI向量搜索功能,查找与输入图像在语义上相似的房屋。在Oracle Database 23ai中还可以使用SQL语句将AI向量搜索与业务数据(关系型数据)相结合,例如客户的预算和位置偏好,以进一步细化搜索结果。这种方法通过结合AI向量搜索和客户的具体业务需求,提供个性化的搜索结果,大大提升了客户体验和业务效率。

对于文档检索这个业务场景,文档搜索功能可以通过两种方式实现:关键词搜索和语义搜索,以及结合生成式AI的智能文档处理,如下图所示:

1. 基于关键词和语义的文档搜索

通过关键词搜索,系统可以快速找到包含特定关键词的文档内容;而通过语义搜索,系统能够理解用户查询的意图,并返回与查询语义上相关的文档。这种混合搜索方式结合了传统的文本搜索和AI驱动的向量搜索技术,确保更高的搜索精度和相关性。例如,用户可以输入“为什么我的电视屏幕闪烁?”这样的问题,系统会基于语义搜索,找出相关文档并提供解答,而不仅仅是简单匹配“电视”和“屏幕”这类关键词。

2. 使用生成式AI处理特定文档

在第二种场景下,Oracle Database 23ai结合了生成式AI技术,使得企业可以根据自身的特定文档,生成内容或提供自动化的文档总结、解释等服务。通过生成式AI,用户可以基于自然语言输入快速获得与其企业文档相关的个性化内容。例如,企业可以让生成式AI根据合同或技术文档生成总结或建议,提升文档处理的效率和智能化水平。

这两种文档搜索方式能够帮助企业在处理大量非结构化数据时,快速获取所需信息,并通过AI技术提升文档处理的智能化和自动化程度。

AI的引入彻底改变了文档搜索的方式,如下图所示向量化文档搜索流程。向量化文档搜索流程利用AI实现了大规模文档检索的效率和准确性。传统搜索方法依赖于关键词匹配,这在处理大量文档时可能很慢且不准确。向量化文档搜索流程的关键优势在于其与 LLM 生成式AI的集成,使用AI,我们可以捕捉文档的语义,这意味着我们可以理解它们的意图和上下文。这种方法极大地提高了搜索速度,同时确保了复杂查询的高精度匹配。

Oracle Database 23ai引入了强大的混合向量搜索功能,结合了 Oracle Text 的强大功能和向量检索的先进性。
Oracle Text 长期以来一直是 Oracle Database 中全文搜索功能的支柱,它使企业能够在各种数据类型中进行快速、准确的文本搜索。现在,通过引入向量检索,Oracle Database 23ai 提升了搜索功能。
向量检索超越了传统的关键词搜索,它利用向量来捕捉数据的语义特征。这意味着它可以理解数据的意图和上下文,而不仅仅是单词本身。通过这种方式,混合向量搜索可以提供更准确、更相关的结果。
通过结合 Oracle Text 的精确性和向量检索的语义理解,Oracle Database 23ai中的混合向量搜索可以处理各种数据类型,包括结构化、半结构化和非结构化数据。无论您是搜索文档、图像还是数据库中的信息,它都可以提供见解。
这种混合方法使企业能够利用其所有数据的全部潜力。对于需要处理大量复杂数据的组织来说,特别有用。通过混合向量搜索,企业可以快速、有效地发现信息,做出更明智的决策并提高业务效率。
Oracle Database 23ai带来了企业知识聊天机器人的革命,这是基于大型语言模型 (LLM) 的一项强大功能。Oracle通过将LLM与其数据库内置的AI功能相结合,为企业提供了构建智能且具备“企业知识”的聊天机器人的独特机会。
这些聊天机器人不仅可以理解和响应日常的自然语言对话,而且由于它们与 Oracle Database 23ai的无缝集成,它们还可以访问和利用企业特定的数据。这意味着它们可以提供个性化的、针对您的业务的响应。Oracle Database 23ai的关键在于其先进的向量搜索技术。通过利用混合向量检索技术,聊天机器人可以从多种数据源(包括文档、结构化数据和业务知识库)中提取有用信息。通过与 LLM 的集成,它可以生成准确、详细且有见地的响应。

考虑一种场景:聊天机器人帮助客户寻找产品信息。凭借向量搜索功能,它可以快速扫描大量文档,并根据客户的查询从结构化数据中提取相关详细信息。此外,它可以利用企业知识库来提供深入见解,例如推荐补充产品或服务。

Oracle Database 23ai中的LLM还使聊天机器人能够随着时间的推移进行学习和适应。它们可以从与用户的互动中进行调整,提供越来越准确和相关的响应。这种自适应能力确保了聊天机器人的长期价值,因为它们可以随着企业的发展和变化而发展和变化。

通过Oracle Database 23ai,企业可以利用生成式AI(GenAI)和检索增强生成(RAG)技术,为用户提供实时且上下文相关的答案,从而大大提升业务效率,提高客户参与度、改善客户服务并增强整体客户体验。通过利用 Oracle Database 的AI功能,企业可以构建智能且直观的聊天机器人,为客户带来真正个性化的互动。

总结,借助Oracle数据库,实现多种基于人工智能的业务解决方案。

核心功能与优势:

多途径解决业务难题: 提供多种方法来应对常见的业务问题,满足不同场景的需求。

传统机器学习与数据库深度融合:将传统的机器学习算法与数据库内的数据进行结合,实现企业级数据的智能分析。

关键词与语义搜索:不仅能通过关键词精确查找文档,还能根据文档的语义内容进行更深入的搜索。

SQL调用生成式AI:通过简单的SQL语句即可调用生成式AI,实现文本生成、代码生成等多种功能。

即将推出的更多AI功能:Oracle Database 23ai将带来更多先进的AI功能,为企业提供更强大的数据分析和智能决策能力。


编辑:范宏伟

最后修改时间:2024-09-25 14:44:58
文章转载自甲骨文云技术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论