暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库中的机器学习

甲骨文云技术 2023-07-26
563

大型和小型企业都知道应用机器学习技术来解决关键业务问题并在其行业中获得领先地位。机器学习可应用于广泛的业务问题,从医疗保险欺诈检测到制造业根本原因分析,从零售产品推荐到设备剩余使用寿命预测。随着企业积累更多的数据量并利用外部数据源补充企业数据,大规模数据集成和准备机器学习数据的能力至关重要。此外,简化从业务问题定义到解决方案部署的时间对于实现数据科学项目的投资回报率至关重要。借助Oracle 机器学习客户取得了令人瞩目的成果。

作为 Oracle AI 平台的战略部分,Oracle 机器学习使数据科学家和数据分析师能够直接处理 Oracle 数据库和 Oracle 自治数据库中的大量数据来提取知识、发现新见解并做出数据驱动的预测。Oracle Machine Learning 使应用程序开发人员能够轻松部署和使用支持应用程序和仪表板的机器学习模型和解决方案,从而为应用程序开发人员提供支持。本文会向大家介绍 Oracle 机器学习以及它如何帮助企业数据科学及业务分析团队从数据中实现更大价值。

价值一:移动算法,而不是数据!

在数据所在位置进行大规模机器学习和数据分析 – 几乎不需要移动数据,简化数据科学和机器学习解决方案架构和部署。Oracle 的融合数据库将机器学习和其他分析技术置于单一、安全、集成、可扩展的平台中,让您触手可及,同时为您的团队扩展数据访问和共享。作为 Oracle 融合数据库战略的关键部分,Oracle数据库中的机器学习可帮助您快速开发和部署数据驱动的解决方案。

借助 Oracle Machine Learning,Oracle 将算法转移到数据中。Oracle 在数据所在的数据库中运行机器学习。这种方法可以很好地减少或消除数据移动带来的资源成本消耗和安全隐患,实现可扩展性,保护数据安全性,并加快模型部署时间。Oracle 提供机器学习算法的数据库内并行实现,充分利用已有Exadata Cloud@Customer、Exadata、公有云、第三方开放平台的计算和存储资源,并与领先的开源环境 R 和 Python 集成。Oracle 机器学习提供企业级数据科学项目所需的性能、可扩展性和自动化(无论是在本地还是在云中)。

成功案例 - 英国国家医疗服务体系 (NHS)是英国的公共医疗保健提供者,能够收集和分析来自整个组织的数十亿个有关处方、药品、医疗豁免、医生关系和呼叫中心服务的数据点,以揭示潜在的更有效治疗方法,以提供更好的投入产出结果。NHS 实现了非常快的投资回报 — 前 2 年内实现了 5.81 亿英镑或 7.17 亿美元 ,并在 5 年内实现了超过 15 亿英镑或近 20 亿美元,这个金额还在不断增加。

“借助 Oracle 高级分析,可以更轻松地检测行为异常。我们使用异常检测来发现牙医索赔中可能存在不当行为的证据,使 NHS 专员能够跟进并质疑他们的活动。”

Nina Monckton,NHSBSA 信息服务主管

NHS数据实验室利用数据智能寻找节省医疗保健预算和成本的方法

•识别账单和身份欺诈

•通过使用更少的药物来优化治疗效果的医疗程序

•部署了 Oracle 高级分析,以及Oracle Exadata 和 Oracle 商业智能

“由一家供应商提供整个解决方案,这极大减轻了我们的负担。”

-Nina Monckton, NHS BSA

价值二:Oracle数据库——多模型融合数据库

用户不必创建和管理多个数据库来访问不同的分析功能,这会增加复杂性和成本。相反,所有这些功能都应该存在于一个融合的多模型数据库中,将可以对具有各种数据类型和数据模型的数据进行操作的广泛算法集合在一起。这是 Oracle 数据库的一个关键差异化因素,并强化了 Oracle 为更多的开发人员提供此类高级开发工具的目标。

在数据库领域,Oracle 融合数据库可以支持所有类型的数据和处理。关系数据、文档数据、空间数据、文本数据、湖仓数据和图数据都可以在同一个数据库中有效地存储和处理。OLTP、实时分析、机器学习、物联网和区块链工作负载都可以在同一数据库中高效运行。不再需要部署、管理和同步许多专用数据库来使用这些技术。

与智能手机一样,Oracle 融合数据库不仅支持这些数据类型和工作负载,而且比专用数据库做得更好。此外,将所有这些功能集中在一个数据库中的协同作用可以实现新的可能性,例如直接在 OLTP 系统中进行基于实时机器学习的欺诈检测。此外,使用声明式开放 SQL 而不是专用数据库所需的定制语言,可以使开发人员更轻松地实现这些技术。通过与 Oracle分析平台集成,用户可以无缝地集成数据库内机器学习模型,在分析数据和生成仪表板时引入预测和见解。

价值三:使用 SQL、R 和 Python 多语言为企业用户提供支持

不同的业务问题及其基础数据需要不同的分析技术和算法才能成功。Oracle 数据库包含 30 多种此类算法。Oracle Machine Learning 为关键数据科学语言提供原生接口:SQL、R 和 Python。通过 SQL API,数据库内模型是一级Oracle数据库对象,具有许多可用于其他数据库对象(例如表和视图)的相同数据管理功能。

通过支持 R 和 Python,数据科学家和其他 R 和 Python 用户可以将 Oracle 数据库作为高性能并行计算引擎来访问,以便使用本机 R 和 Python 函数和语法进行可扩展的数据探索和准备。数据库内算法还带有原生的 R 和 Python 接口及扩展包。

价值四:机器学习自动化

为了提高数据科学家的工作效率并支持非专家用户,Oracle Machine Learning 在 OML4Py 和无代码 OML AutoML UI 中引入了自动化机器学习 (AutoML)。OML4Py AutoML 使用三个主要功能支持建模管道的显式构建:算法选择、特征选择和模型调整,是OML AutoML UI的基础。

借助 Oracle Autonomous Database 上的 Oracle Machine Learning AutoML 用户界面,您可以使用较少的输入(数据和要预测的目标)构建数据库内机器学习模型,该工具将完成其余工作以生成由机器学习元模型指导的模型。 OML AutoML UI 提高了数据科学家的工作效率,同时使非专家更容易使用机器学习。OML AutoML UI 还可以帮助您将数据库内模型部署到 OML 服务,并使用 OML4Py Python API 为选定模型生成可编辑笔记本。配套的 OML 模型界面可帮助您管理模型和部署。

价值五:生产部署——关键一步

有些人可能将生产部署称为数据科学项目的致命弱点。当应用程序开发人员或 IT 尝试在生产中集成机器学习模型或开源 R 和 Python 脚本时,他们面临着解决备份、恢复、安全性和可扩展性问题的现实。Oracle 机器学习提供集成的机器学习平台,部署是即时的 – SQL 派生模型存在于数据库中,可以从 SQL 查询中调用,R 和 Python 脚本可以存储在 Oracle 数据库中,并在由甲骨文数据库生成和控制的引擎中执行。Oracle 通过提供“管道”极大地简化了生产部署,使企业团队可以专注于机器学习解决方案。

Oracle 机器学习服务支持模型管理、部署和监控,同时受益于系统提供的基础设施和集成数据库架构。模型管理和部署服务使用户能够从本地 Oracle 数据库和自治数据库部署数据库内机器学习模型,以实现分类、回归、集群和特征提取等机器学习技术。OML 服务支持数据库内机器学习模型以及以 ONNX 格式导出的模型。此类 ONNX 格式模型可以从Tensorflow、PyTorch、Scikit-learn 等第三方软件包生成。此外,OML 服务支持认知文本分析,包括提取主题和关键字、情感分析以及文本摘要和相似性分析。OML 服务针对预测进行了优化,以支持流媒体和实时应用程序。

成功案例 - DX Marketing (DXM)是一家屡获殊荣的洞察公司,帮助各行业的企业利用大数据很好地提高营销投资回报。DXM 选择了 Oracle Autonomous Data Warehouse 和 Oracle Analytics 的组合。这种强大的组合提供了端到端解决方案,自治数据仓库提供了与多个数据源连接的智能存储库,提供了人工智能驱动的见解以及分析师能够生成的简单可视化,特别是加快了新人工智能功能的掌握速度。

两个客户被用作这种新数据范式的试点项目,一个在电信领域,另一个在金融服务领域。选择两者都是因为其数据的复杂性,具体来说,是通过机器学习算法处理复杂数据获得潜在回报。 DXM 的分析师创建了脚本,将传入数据与其他许可数据(家庭人口统计、物理测绘等)以及正在投放的创意广告连接起来。利用预测模型,媒体支出被显著优化,以降低客户获取成本。

“这对我们来说是一个非常宝贵的工具。仅仅六个月的时间,我们就已经实现了一些传统数据库例程可能无法提供的关键功能。”

Ray Owens 首席执行官 DXM

Oracle 机器学习的特点:

l将算法引入数据,消除昂贵的数据移动和访问延迟

lOracle 将机器学习集成到整个 Oracle 系列和企业中,充分利用 Oracle 数据库和 Oracle 自治数据库资源

l通过机器学习为数据科学家、数据分析师、开发人员和 DBA/IT 提供支持

l快速且可扩展的数据探索、数据准备和机器学习算法

l支持 30 多种算法:回归、分类、时间序列、聚类、特征提取、异常检测

lR 和 Python 集成利用开源生态系统直接支持数据科学家角色

l易于机器学习模型和 R/Python 脚本部署

l自动执行关键机器学习流程步骤,包括用于建模的 AutoML

l通过 SQL 和 REST 接口轻松部署机器学习模型

l利用现有的企业备份、恢复和安全机制和协议

结论

作为 Oracle 融合数据库战略的一部分,Oracle 机器学习在 Oracle 数据库和大数据环境中提供可扩展、并行的机器学习算法。Oracle Machine Learning 提供支持分类、回归、聚类、关联规则、特征提取、时间序列、排序、行重要性和异常检测的机器学习算法。您可以通过多个接口使用机器学习算法,包括 OML Notebooks、OML AutoML UI、适用于 SQL、R 和 Python 的流行语言 API、OML Services 和 Oracle Data Miner。

Oracle 机器学习算法充分利用 Oracle 数据库的可扩展性、并行性、安全性以及结构化和非结构化数据处理功能。这使得 Oracle 成为开发机器学习解决方案并将其嵌入本地或 Oracle 企业应用程序的强大平台。Oracle 数十年领先的数据管理经验与“移动算法,而不是数据”的战略相结合,通过将数据管理和机器学习集成到融合的 Oracle 数据库中,您可以从降低拥有成本、消除数据移动和快速解决方案部署中受益。

编辑:殷海英


最后修改时间:2023-07-26 09:49:35
文章转载自甲骨文云技术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论