暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

AI的优劣取决于驱动它的数据

Andy730 2024-03-09
5

AI近年来被赋予了多重标签——革命性的技术、经济变革的推手、乃至炒作过度的“猛兽”。但在看来,AI更像是信息革命崭新阶段的体现,犹如工业革命或科学革命一般,是人类进步历程中的又一重要里程碑。与历史上的重大创新相似,AI既可能成为推动社会进步的积极力量,亦可能带来一系列复杂挑战。

AI对企业而言,蕴藏着巨大的潜力。以机器学习为驱动的预测性AI,在识别模式、提升效率方面展现出了卓越的能力,为解决商业和社会问题提供了前所未有的速度与精准度。无论是优化医学研究,如预测蛋白质折叠对生物功能的影响,还是防范金融欺诈、保护客户与公司利益,亦或是辅助自然灾害规划,通过精准预测危机及其连锁反应,AI都展现出了其无可替代的价值。我们对此有着深刻的理解,多年来,我们协助众多客户实现了这些AI驱动的目标。

更值得一提的是生成式AI,它不仅能够识别现有模式,更能创造全新的模式。这一特性使得软件开发更为高效,为内容创作者带来了更为沉浸式的体验,同时帮助客户、员工、民众和学生更便捷地获取所需信息。

然而,所有这些令人振奋的可能性,都源于一个关键因素:数据。这一事实早已不言而喻——优质的数据集使得上一代AI工具能够做出更为精准的预测。大型语言模型通过利用庞大的数据集,已经推动生成式AI达到了新的能力高度。当前,通过运用客户的私有数据,我们不仅能够为模型提供更丰富的背景关联信息,实现更精细的微调,还能助力其做出更为明智的决策,从而迅速提升这些基础模型的性能。正如著名计算机科学家Peter Norvig所言:“聪明的算法固然重要,但更多的数据更为关键;而优质的数据,更是胜过单纯的数据量。”

当前所需三大要素:整合、效能信任

在AI的实际应用中,管理多个版本的模型并确保其与最新数据集同步至关重要。这意味着,无论是企业自有的数据还是客户用于优化AI系统的其它相关数据,都需实现自由流通。当然,我们深知数据的自由流通并不意味着简单的数据堆砌。数据量不仅庞大且源源不断,还呈现出分散、非结构化的特性,同时必须确保数据安全。复杂的技术、组织间的隔阂以及数据孤岛,均是阻碍AI项目顺利投入生产的主要难题。为了最大化AI的效益,需要一个完整、强大且可持续的解决方案,突破传统数据孤岛的束缚。一个现代化、智能化、集成化的混合云数据基础设施,无疑是AI成功应用的基础。

无论是中小企业还是行业巨头,以下是一些建议,优化数据引擎,充分利用智能技术革命的红利:

  • 确保数据与AI组织的高度整合在AI与数据驱动的未来,组织面临的最大挑战之一是数据的所有权碎片化、数据平台与基础设施的孤立,以及各领域专家在孤立环境中工作。例如,许多组织拥有擅长数据分析的数据分析师和工程师、能够运用现代数据分析工具的数据科学家,以及了解如何运用数据与AI建议推动业务发展的业务分析师。这些角色需紧密协作,形成合力,以加速AI的影响。

  • 评估并整合非结构化数据多年来,企业一直投资于从结构化数据(如数据库、数据仓库和业务智能工具)中提取价值的工具。然而,生成式AI提供了一个强大的引擎,能够从非结构化数据中获取价值,这部分数据不仅占公司数据的大部分,而且是增长最快的部分。文本仍是大多数组织数据的主要格式,文档、音频文件以及大型文件(如图像和视频)构成了公司数据的主体。自然语言处理(NLP)和计算机视觉(CV)作为最成熟的AI工具之一,也是生成式AI中应用最广泛的工具。因此,确保对非结构化数据及其相关应用有清晰的认识,以便将其与业务的生成式AI应用无缝对接。

  • 将工作负载与数据全面整合至智能混合多云基础架构中,已成为当下的迫切需求随着数据量、类型及流速的迅猛增长,处理大规模数据时,简单性与整合性显得尤为关键。数据管道,作为一个集收集、传输、处理、转换、存储、检索及呈现数据于一体的架构系统,正日益受到业界瞩目。如今,领先的AI团队正致力于构建混合云数据管道,旨在将公有云的卓越可扩展性与持续创新速度,与本地环境的稳固安全性与高效治理相结合。

  • 在追求数据价值的同时,我们必须将数据安全与治理置于首要位置权力与责任往往并存,这一道理虽显陈词滥调,但其在AI领域的适用性不容忽视。从安全视角来看,AI固然能实时识别网络威胁并构建错误检测模型,但其潜在风险亦不容忽视。私人数据在AI的加持下变得更具价值,但也可能成为模型错误、偏见及其它不准确性的源头。因此,确保数据的安全与有效治理至关重要。

通过优化数据引擎,我们不仅能够为AI的蓬勃发展奠定坚实基础,还能在确保安全、经济、负责任的前提下,充分释放其潜力。

-----

Source:George Kurian; AI is only as good as the data that fuels it; September 19, 2023


---【本文完】---

近期受欢迎的文章:

  1. 洞悉2024:人工智能与企业级IT的十大趋势(深度)

  2. NetApp公司AI解决方案深度解析(PPT)

  3. 剖析NFSv3与NFSv4的关键差异

  4. 颠覆传统:NAS的发展和革新

  5. Hyperscale NAS技术概述



更多交流,可添加本人微信

(请附姓名/关注领域)

文章转载自Andy730,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论