如今,企业只发挥了数据巨大变革潜力的小部分,因为很多企业积累了大量的数据,包括结构化和非结构化数据,而让企业已有技术人员基于这些数据实施机器学习是一个巨大的挑战。同时企业如何利用云服务的敏捷等特性进行数据存储和组织,又要开放数据给分析人员使用,如何应用数据科学,与Hadoop/Spark等大数据技术实现融合等,这都是企业面临的一系列问题。
即便是有的企业构建了数据科学团队,数据科学团队会发现无法轻松访问合适的数据和使用合适的工具来构建和部署有效的机器学习模型。最终结果是,模型开发时间过长,并不总是满足企业对准确性和可靠性的要求,这种情况过于频繁,因此很多企业只是进行机器学习研究而从未投入生产。
Oracle近期宣布推出云数据科学平台相关的一系列云服务和能力。其核心是Oracle Cloud Infrastructure Data Science(云基础架构数据科学),帮助企业协作构建、训练、管理和部署机器学习模型,以提高数据科学项目的成功。与其他专注于数据科学家个人开发的数据科学产品不同,Oracle 云基础架构数据科学通过共享项目、模型目录、团队安全策略等功能帮助提高数据科学团队的有效性,可重复性和可审计性。Oracle 云基础架构数据科学通过 AutoML 算法选择和调优、模型评估和模型说明自动选择最佳训练数据集。
OCI数据科学云服务专为数据科学团队和科学家而设计
Oracle 云基础架构数据科学包括自动化数据科学工作流,通过以下功能节省时间和减少错误:
AutoML 自动算法选择和调优可自动针对多个算法和超参数配置运行测试。它检查结果的准确性,并确认选择了最佳模型和配置供使用。这为数据科学家节省了大量时间,更重要的是,它旨在让每个数据科学家都能获得与最有经验的实践者相同的结果。
自动预测功能选择通过自动识别来自较大数据集的关键预测要素来简化要素工程。
模型评估可生成一套全面的评估指标和适当的可视化效果,以根据新数据测量模型性能,并可以随时间对模型进行排名,以实现生产中的最佳行为。模型评估超越了原始性能,以考虑预期的基线行为,并使用成本模型,以便充分纳入假正向和假负向的不同影响。
模型说明:Oracle 云基础架构数据科学提供了对生成预测的因素的相对权重和重要性的自动解释。Oracle 云基础架构数据科学首次提供了模型无关的解释的商业实现。例如,使用欺诈检测模型,数据科学家可以解释哪些因素是欺诈的最大驱动因素,以便企业可以修改流程或实施安全措施。
将有效的机器学习模型成功投入生产,需要的不仅仅是专门的人员。它需要数据科学家团队协同工作。Oracle 云基础架构数据科学提供强大的团队功能,包括:
共享项目可帮助用户组织、启用版本控制并可靠地共享团队的工作,包括数据和笔记本会话。
模型目录使团队成员能够可靠地共享已构建的模型以及修改和部署模型所需的工件。
基于团队的安全策略允许用户控制对模型、代码和数据的访问,这些模型、代码和数据与 Oracle 云基础架构身份和访问管理完全集成。
可重复性和可审计功能使企业能够跟踪所有相关资产,以便即使团队成员离开,也可以复制和审计所有模型。
借助 Oracle 云基础架构数据科学,组织可以加速成功的模型部署,并生成企业级结果和性能,用于预测分析,从而推动实现积极的业务成果。
Oracle提供了全面的数据和机器学习服务
Oracle 数据科学平台云服务系列包括七项新服务,可提供全面的端到端体验,旨在加速和改进数据科学结果:
Oracle Cloud Infrastructure Data Science(云基础架构数据科学服务):使用户能够使用 Python 和其他开源工具和库(包括 TensorFlow、Keras 和Jupyter)在 Oracle 云上构建、训练和管理新的机器学习模型。
Oracle 自治数据库中新的强大的机器学习能力:机器学习算法紧密集成到 Oracle 自治数据库中,对 Python 和AutoML提供了新的支持。即将支持与 Oracle 云基础架构数据科学集成,将使数据科学家能够使用开源和可扩展的数据库内算法开发模型。无独有偶,将算法引入 Oracle 数据库中的数据,通过减少数据准备和移动来加快生成结果的时间。
Oracle Cloud Infrastructure Data Catalog(云基础架构数据目录服务):允许用户在 Oracle 云上发现、查找、组织、丰富和跟踪数据资产。Oracle 云基础架构数据目录具有内置的业务术语表,便于整理和发现正确的可信数据。
Oracle Big Data Service(大数据服务):提供完整的Cloudera Hadoop 环境,其管理比其他 Hadoop 产品简单得多,只需点击一下即可使群集高度可用并内置企业级安全性。Oracle 大数据服务还包括 Spark 的机器学习,允许组织在内存中使用一种产品和最少的数据移动运行 Spark 机器学习。
Oracle Cloud SQL:支持对 HDFS、Hive、Kafka、NoSQL 和对象存储中的数据实现统一的 SQL 查询。只有 Cloud SQL 可以使任何可以与 Oracle 数据库交互的用户、应用程序或分析工具能够透明地处理其他数据存储中的数据,并具有查询下移、横向扩展处理的好处,以最大限度地减少数据移动。
Oracle Cloud Infrastructure Data Flow(云基础架构数据流):一种完全托管的大数据服务,允许用户运行 Apache Spark 应用程序,无需部署或管理任何基础结构。它使企业能够更快地交付大数据和 AI 应用程序。与其他友商提供的 Hadoop 和 Spark 服务不同,Oracle 云基础架构数据流包含一个单一界面,用于跟踪所有 Spark 作业,从而轻松识别昂贵的任务或排除故障。
用于数据科学的 Oracle Cloud Infrastructure Virtual Machines(云基础架构虚拟机):预配置的基于 GPU 的环境,具有通用的 IDEs、笔记本和框架,可在 15 分钟内启动和运行,每天 30 美元。
客户之声
AgroScout 致力于检测早期农作物疾病,以提高作物产量、减少农药使用和增加利润。"我们的愿景是让在全球5亿个农场工作的10亿农民(占全球劳动力的30%)在获得经济的现代农艺,我们计划通过提供基于云的 AI 驱动的可持续农艺,完全依靠低成本无人机、移动电话和种植者的人工投入来实现这一目标,"AgroScout创始人兼首席执行官 Simcha Shore 说,"这一愿景的成功取决于管理持续且不断增长的数据输入流的能力,以及我们自己的基于AI 的解决方案,从而将数据大规模转化为精确和决策农业。Oracle 云的速度、规模和敏捷性帮助我们实现了梦想。现在,随着最近发布的 Oracle 云基础架构数据科学,我们提高了数据科学家协作构建、训练和部署机器学习模型的能力,从而开辟了新的视野。这一新增功能降低了成本,提高了效率,并帮助我们更快地扩大全球业务。”
IDenTV 提供基于 AI 功能的高级视频分析,这些功能由计算机视觉、自动语音识别和文本语义分类器提供支持。"借助 Oracle 云基础架构数据科学,我们能够扩展数据科学工作,以前所未有的速度实现业务价值。我们的数据科学团队现在可以无缝访问数据,而不必担心数据位置或访问机制的复杂性。在使用嵌入环境中的 TensorFlow、Keras 和Jupyter 笔记本等开源功能的同时,我们可以简化模型训练和部署任务,从而节省大量成本并加快结果,"IDenTV创始人和首席运营官 Amro Shihadah 说,"我们认为,Oracle 云基础架构数据科学与自治数据库的优势相结合,使我们具有市场竞争力和保持独特性。“
Oracle支持企业从不同角度落地数据科学
Oracle数据科学平台相关云服务支持企业从不同角度启动大数据分析和机器学习,落地数据科学并实现数据价值,具体适用范围如下:

Oracle数据科学平台相关云服务与Oracle自治数据库ADW/ATP,分析云服务OAC,对象云存储服务Object Storage,流服务Streaming Service等一起,构建起企业全面的数据分析和数据科学架构,如下图:

这里以国内某大型制造集团为例,该企业是Oracle本地化Exadata和大数据平台的客户,前期使用ADW来快速存储从第三方获取的客户和市场信息,通过ADW和OAC进行快速分析和展现,提供给业务部门使用,通过ADW和OAC中的机器学习,支持客户画像和精准营销等,并通过ODI/OGG实现云中数据和本地数据的融合。该集团海外子公司采用Oracle新一代基础架构云服务支撑其物联网应用:
1、通过流服务收集数据存储到对象存储或ADW中,也可引入第三方云中的外部数据
2、通过数据流云服务,利用Spark作业来并行处理对象存储中海量数据
3、数据汇聚到Oracle大数据云中进行后期交互查询和深度分析
4、通过数据目录服务,可以对不同来源的数据定义元数据并提供共享数据服务
5、国内外数据科学家团队可以通过数据科学云服务实现团队协作,进行数据科学探索
6、数据科学云服务可以使用对象存储和ADW中的数据训练和应用模型,有价值的模型可以在ADW云或计算云中运行,也可以在国内本地大数据平台中使用分析海量数据。
7、通过Oracle分析云提供给业务人员和管理者对分析结果实现快速可视化和增强分析
8、通过Cloud SQL和REST API提供分析结果给其他应用使用。
通过一系列云服务的集成,该企业能够持续地满足业务应用支撑和扩展、数据分析,数据科学和数据服务的需求,极大地推动了企业数字化转型和实现业务创新。
看了如上介绍,想必您已经跃跃欲试了吧,数据科学云服务目前已经在韩国,日本,美国,欧洲等多个数据中心上线,还等什么,请联系Oracle销售,开启您的企业的数据科学落地之旅吧。
扫描下方QR Code即刻预约ADW演示

编辑:萧宇





