暂无图片
暂无图片
3
暂无图片
暂无图片
暂无图片

52位专家对2023年的96项数据管理预测

原创 通讯员 2022-12-23
452

Solutions Review 编辑收到了专家对 2023 年的数据管理预测,这是第四届年度 BI Insight Jam 的一部分。

作为 Solutions Review 的第三届年度#BIInsightJam的一部分,我们呼吁业界最优秀和最聪明的人分享他们对 2023 年的数据管理预测。这里的专家代表了在这个领域具有经验的顶级数据管理提供商。数据管理预测也已经过相关性和增加业务价值的能力的审查。这些是我们收到的几十个预测中最好的预测。我们相信这些是可行的,并且可能会影响许多垂直行业、地区和组织规模。

注意:数据管理预测按我们收到的顺序列出。

专家对 2023 年的数据管理预测


Christian Buckner,Altair 数据分析和物联网高级副总裁

大数据还没有死

供应商将试图引领潮流,我们将看到许多供应商开始宣传“大数据已死”。相反,许多组织正在依赖“智能数据”以获得更深入的洞察力。但尽管有广告,大数据仍将继续在业务运营中发挥重要作用——目前如此。关键是要确保您拥有易于使用的自助服务工具,能够清理、验证和准备数据,然后将这些数据插入数据分析模型以获得有价值的结果和明智的决策。将大数据转化为智能数据的公司将受益于新的数据思维方式。”


Tamr 联合创始人兼首席执行官 Andy Palmer

数据湖的未来

“多年来,数据湖一直致力于解决数据混乱问题。许多组织将他们不断增长的数据体倾倒到数据湖中,希望将所有数据集中在一个地方将有助于对其进行整理。但数据湖被过度炒作,而且往往缺乏适当的治理。如果没有干净、精选的数据,它们根本无法工作。这就是为什么许多实施数据湖的组织意识到他们实际拥有的是数据沼泽。

拥有干净、精选的数据很有价值。这是事实。但脏数据沼泽并非如此,组织必须优先考虑准确和集成数据的重要性,制定消除数据孤岛的战略,并让清理数据成为每个人的责任。”


Okera 首席执行官 Nick Halsey

隐私法规将继续激增,需要采取积极主动的方法

“到 2022 年,全球和美国各州对数据隐私法规激增的担忧将加剧。在对罚款和品牌声誉受损的恐惧的驱使下,在合规之旅中取得进展的公司将把他们的担忧从单纯的how-to,现在专注于如何在不同的法规之间进行仲裁。一种常见的方法是满足一项主要法规(可能是 CCPA 或 GDPR)的技术要求,然后根据需要将其他法规所需的功能分层。这种对监管合规采取观望态度的后果将导致公司进一步落后,同时风险继续增加——如果他们在来年不采取果断行动的话。”

治理是实时的

“当我们想到治理时,我们通常会考虑制定一项政策——什么角色可以访问什么数据——并让系统根据该政策允许或禁止用户访问。基于国家的政策改变了游戏规则。一些法规不仅限制谁可以访问什么数据,还限制授权用户在尝试访问数据时被允许在何处。其他法规根据日期、时间、系统状态和其他变量限制访问。各种基于状态的法规和变量的这种组合可能意味着更精细的数据访问策略,对治理系统提出了新的要求层。该政策不再是静态的,必须实时对某些变量做出反应。到 2022 年,我们将看到企业和供应商面临越来越大的压力,要求他们将工具部署到位,以实现实时、


Nik Acheson,Okera 首席数据官

数据主体访问请求被增压

“随着更多违规行为被公开,政策制定者被迫代表沮丧的消费者群体,并让公司承担更多责任。因此,我们继续看到政策、法规和许可的蓬勃发展,企业高管因未遵循最佳实践而被追究责任。

到 2023 年,新技术以及法律界的关注将加速发展,使个人能够更好地了解和控制他们的数据被使用的内容、地点和方式。更糟糕的是,它将削弱许多仍在为数据过度配置、缺乏全面可见性以及在当代分布式数据环境中运行的遗留模式而苦苦挣扎的企业。” 

数据契约变得更加真实,业务终于介入

“太多的工程团队都在努力维护数据质量、访问和跟踪使用模式。虽然许多企业都有与核心企业分析团队合作的职能分析专业人员,但数据和/或分析工程专业人员仍在浏览数据域并验证来自数据构建工具的数据。

到 2023 年,数据的持续激增最终将迫使企业对数据拥有更多的所有权,不仅是在使用和解释方面,而且在数据管理和供应的模式方面也是如此。分布式管理将成为现实,实现这一目标的最佳方式将是使用不是为工程师构建的工具,而是使用明确映射所有权、使用、依赖关系等的数据契约。这将随着数据目录和/ 或自 confluence 以来出现的一些初创公司不会大规模削减它。”

拥抱数据网格的公司与那些锁定的公司之间存在更大的分离

“正如我们早期在 GDPR 中看到的那样,数据访问请求会导致两种主要响应:加速数字和数据创新和现代化与删除和锁定。与 Covid 病毒类似,一些清算资产难以生存,而另一些资产则接受了新的数字环境,并意识到情况将有所不同,客户将改变他们的行为、购买模式和兴趣。到 2023 年,希望长期生存的公司将需要解决围绕数据许可、使用和可见性不断变化的政策,否则将面临较低的估值和法律问题。客户将越来越多地要求更多的责任感,并以他们不再信任的公司的购买行为作为回应。”

增加行业跨平台连接

“就在几年前,一家快速发展的独角兽公司的首席执行官告诉我不要使用另一家科技公司,另一家现在在数据世界中心运作的独角兽。这位 CEO 指出,他们永远不会与他们整合,他们会强迫我使用他们的本地工具,而且公司要么构建得更好,要么购买它们。鉴于我对这家特定公司的依赖,并且作为我架构的关键部分,他是对的——当时我别无选择,只能答应。从那以后的几年里,我继续看到互联技术社区的发展以及领导者之间的协作。这些领导者讨论问题并公开讨论共同的客户需求,并深切关注共同的成功。

在 2023 财年,我们将看到更多的“现代数据堆栈”公开共享,技术公司相互促进,其他公司改进抽象层,企业继续全力以赴模块化和构建有意的成熟度路线,以提供业务和客户改进的结果快点。当数据和系统无法在整个可见范围内运行时,数据扩散和民主化就会变得危险,在 2023 财年,我们将看到科技公司继续采取措施,通过支持和更开放的连接来实现客户偏见和成功。”


Coalesce 联合创始人兼首席执行官 Armon Petrossian

数据即产品的兴起

到 2023 年,数据即产品将走向成熟,从而提高公司对数据的质量和信任度。这将导致企业内更强大的数据组织,这些组织对数据建模技术和数据团队/工程师的需求增加。”


Coalesce 联合创始人兼首席技术官 Satish Jayanthi

数据建模的回归

到 2023 年,花了近十年时间呼吁深思熟虑地构建基础数据基础设施,而不是急于构建有吸引力的产品的行业资深人士将迎来他们的“我告诉过你”的时刻。数据建模正在卷土重来,同时人们意识到,如果没有提供高质量数据的基础设施,企业将无法实现预测分析、机器学习/AI 的承诺,甚至无法做出真正的数据驱动决策。”

一切皆代码的兴衰

到 2023 年,随着预算可能继续收紧,将出现寻求优化和生产力的趋势。被迫事半功倍的公司不会继续扩大团队,而是会寻找方法来自动化他们曾经手动完成的数据处理。这对于支持自动化、易于使用并且可以腾出时间专注于重复性任务而不是对业务产生影响的平台和工具来说是个好消息。”


Ground Labs 首席布道师 Stephen Cavey

自动化上升

“随着公司首次整合长期孤立的系统和流程,一场悄无声息的革命正在发生。许多公司现在可以采用“数据优先”策略来衡量、优化、保护和自动化每个可能的流程。实施这一战略是一项重大而渐进的工作——远远超过任何一个团队单独完成的工作。虽然企业将设定方向、定义标准、选择工具并提供治理,但最终用户将继续在自动化的帮助下确保数据安全和管理方面发挥关键作用。在未来 10 年内,安全技术和数据管理将默认实现自动化,而不是例外。”


Kyndi 创始人兼首席执行官 Ryan Welsh

企业最终将受益于他们的非结构化数据

“IDC 估计,所有数据中有 80% 是非结构化或自由形式的,因此很难评估和得出见解。组织在文本数据中搜索答案时难以提取相关见解,这主要是因为他们使用的搜索工具无法有效且高效地处理非结构化数据。

认识到摆在桌面上的巨大价值,组织将在 2023 年应用实用方法来显着提高效率并释放长期以来难以捉摸的价值。远程和混合工作加剧了不满意搜索结果的痛苦,因为如此多的员工在自己的位置工作并在不同时间访问信息,这使得组织内的信息共享成为一项重大挑战。当您认为有必要时,您不能简单地向坐在您旁边的同事寻求答案。在接下来的一年里,预计员工会转向自然语言搜索工具,以在所有结构化和非结构化来源中查找相关信息。”


Couchbase 首席技术官 Ravi Mayuram

在以快速、个性化和身临其境的体验为目标的时代,云数据库将达到新的复杂程度

“从数字化转型的角度来看,它是关于技术堆栈的现代化,以确保应用程序无延迟地运行——这反过来又为用户在与应用程序或平台交互时提供了优质的体验。部署强大的云数据库是实现这一目标的一种方式。无服务器化已经成为一种巨大的趋势,使用云数据库将成为管理数据层的实际方式。明年,我们还将看到数据的去中心化,因为它更接近边缘以提供更快、更可靠的可用性。此外,我们将开始看到人工智能辅助数据库的出现,使团队能够事半功倍。数据的激增只会继续,使人工智能辅助数据库成为提高数据生命周期对企业运营效率的关键战略。”


Chris Lubasch,Snowplow 首席数据官兼 DACH RVP

现代数据堆栈

“这是围绕现代数据堆栈进行快速讨论的一年。许多新的供应商如雨后春笋般涌现,尽管经济形势充满挑战,但像 Snowflake 和 Databricks 这样的主要供应商仍在继续他们接管许多技术组件的旅程。但与此同时,出现了质疑现代数据堆栈本身的声音,其解耦方法通常会导致许多工具和高成本,更不用说将它们整合在一起的复杂性了。围绕‘后现代数据堆栈’(只是众多术语中的一个)的讨论已经开始,我们都渴望看到这将在未来几年引领我们走向何方。”


Bassam Chahine,NetApp Instaclustr 高级顾问

数据管理最佳实践

“到 2023 年,随着经济不确定性推动预算限制,企业将寻求从其数据层技术中获得更高的成本效率。作为最佳实践,组织应该以此为契机,在许多经过验证的(和企业就绪的)可用开源数据技术中探索他们的选择,这些技术可以直接取代更昂贵的专有(或开放核心)替代方案。完全 100% 的开源数据层技术,例如 Apache Cassandra、Apache Kafka、Postgres、Redis 等,提供世界一流的可用性、可扩展性和性能,以满足数据最密集的用例。

但同样重要的是,完全开源版本的开源数据层技术为企业提供了拥有自己代码的自由,同时支付零许可费用。并列的是,开放核心产品越来越成为一个开放的骗局,采用真正的开源项目并将它们与附加组件一起重新打包,这些附加组件本应证明昂贵的许可成本是合理的。开放核心解决方案通常被假冒为具有开源可移植性,但整个业务模型是基于捕获具有供应商和技术锁定的企业。作为来年的最佳实践,企业应该专注于识别和避免数据层中的开放核心,在增加预算的同时提高灵活性。”


Retrospect 首席技术官 Brian Dunagan

数据管理

“来年,自由和灵活性将成为几乎所有数据管理专业人员的口头禅。特别是,数据管理专业人员将寻求支持云的数据移动解决方案,并支持跨混合环境(包括磁盘、磁带和云)的数据迁移、数据复制和数据同步,以通过消除数据孤岛来最大化投资回报率。我们同样会看到支持与供应商无关的文件复制和同步的解决方案的增加,这些解决方案可以在非专有服务器上轻松部署和管理,并且可以同时传输数百万个文件——通过 SSL 加密保护传输到/从云传输的数据。”


Veritas Technologies 工程执行副总裁 Deepak Mohan

2023 年对云预算的更多审查

“根据 Veritas 的研究,94% 的组织在云上超支,并且平均超过分配给他们的云预算 43%。随着数据量逐年增长,将其存储在云中的成本也越来越高,这越来越难以证明其合理性。尽管大多数公司已经通过采用云实现了先进的业务战略,但 CEO 和董事会将越来越多地要求云支出 ROI 的透明度。

许多经济学家预测明年经济将持续低迷,我们预计 2023 年对 IT 支出的审查将进一步加强,这将给 IT 领导者带来压力,要求他们证明云预算的合理性,同时寻找减少数据量的新方法。这可能会导致更有效的数据存储和管理策略,例如重复数据删除技术,以确保减少存储消耗。”

低代码/无代码应用程序将产生合规性问题

“低代码/无代码应用程序开发在实现跨公司应用程序开发的民主化方面发挥了重要作用。到 2023 年,低代码/无代码采用将成为主流,任何组织中的非技术员工(公民开发人员)都将有权创建自己的应用程序。虽然这将显着减轻 IT 团队的负担,但也会给组织带来很大的合规风险。由于公民开发人员在实现安全和隐私方面没有相同的经验,因此他们开发的大多数应用程序都不会得到充分的保护,并且可能无法正确应用保护策略。因此,组织不仅会面临合规性问题,他们的应用程序还可能会产生新的漏洞供不良行为者利用。”

更多边缘设备意味着更多漏洞

“Gartner 预测,到 2025 年,超过 50% 的企业管理数据将在数据中心或云之外创建和处理。随着越来越多的数据处理移至边缘,IT 架构变得复杂并增加了攻击面。此外,由于技能和人员短缺,企业通常不会像在数据中心或云中那样对边缘应用相同级别的保护。为了全面保护企业,这些边缘设备中的每一个都需要得到保护和备份。最重要的是,组织需要确定来自边缘设备的哪些数据是关键数据还是非关键数据,以维持存储和保护成本,了解对 IT 预算的额外审查。”


Haoyuan Li, CEO at Alluxio

多云采用正在加速组织数据战略的发展

“随着越来越多的组织在 2023 年发展其数据战略,多云数据基础设施的采用正在加速并将成为新常态。无论云提供商如何,组织都应该接受这一趋势并确保他们的云应用程序是可移植的。更多的组织将把云计算转变为一种无差别的商品,并减轻应用程序的负担。他们的目标是在简化操作的同时实现灵活性、安全性和敏捷性。”

人工智能的大模型正在推动专业基础设施和解决方案的创新

“在过去的几年里,人工智能和深度学习已经成为主流,并达到了与数据分析相同的成熟度。大型模型,从 OpenAI 的 DALL-E 2 图像生成模型到谷歌的 LaMDA 对话代理,预计将在 2023 年占据主导地位。数十亿个文件将用于长时间训练大型模型,需要更专业的基础设施和解决方案。将开发下一代人工智能基础设施来应对这种规模。”

从集中式 Hive 目录到数据湖中的开放表格式

随着数据湖成为数据量和种类不断增长的主要目的地,为 数据湖中存储的数据采用表格格式是理所当然的。越来越多的组织现在已经意识到 Hive 目录已成为核心瓶颈。在云原生时代,去中心化的开放数据表格式大行其道,尤其是在大型数据平台中。到 2023 年,随着 Apache Iceberg、Hudi 和 Delta Lake 的迅速采用,我们预计会看到更多企业数据以开放表格式存储。”

对简化数据访问和数据共享的需求正在上升

随着数据量的增长,数据变得越来越分散。到 2023 年, 组织将越来越需要管理分散在任何地方的数据。此外,跨组织和跨平台的数据共享将变得更加重要。组织有必要制定和实施数据战略,以跨地区、组织、云和平台管理和共享分布式数据。”


Denodo 首席执行官兼创始人 Angel Viña

随着经济衰退的临近,公司将寻求优化基础设施成本

“无论北美是否处于衰退之中,企业都在积极削减成本,减少 IT 基础设施,这一直是 CEO 们容易做出的选择。虽然通过使用云计算和存储成本不断降低,但鉴于组织在数据和分析基础设施方面的大量投资,它仍然可能导致巨额账单。部分归功于存储、计算和应用程序选择的广泛性,公司经常采取推倒重来的策略来实现数据和分析工作的现代化。这种方法不仅成本高昂,而且通常会导致 IT 运营中断。到 2023 年,越来越多的公司将看到 IT 专注于以现代、无中断的方式更新其 IT 基础设施,无论他们的数据完全驻留在一个云、多个云中,还是包括本地在内的混合环境中。”

当多云成为现实时,云中的 FinOps 变得必要

“对于许多公司而言,战略数据资产分布在多个云和地理位置,无论是因为各个业务部门或位置都有其首选的云服务提供商 (CSP),还是因为并购导致这些资产驻留在不同的云中提供商的边界。随着越来越多的数据继续迁移到云端,并且不同地区看到某些云提供商相对于其他提供商的重要性,跨国公司正在加速采用多云架构。目前,没有简单的方法来管理和集成这些不同 CSP 之间的数据和服务。未能解决此问题总是会导致数据孤岛和分散的数据管理方法,从而导致数据访问和数据治理复杂化。

此外,与普遍的看法相反,由于数据量和相关的出口费用等原因,云成本正日益成为一项物质支出。对于许多组织而言,云投资并未带来预期的经济和业务收益。因此,他们正在利用 FinOps 提供一个框架来控制云成本和使用,确定成本与价值,并了解在现代混合和多云环境中优化管理它的方法。在来年,预计 FinOps 将作为一项关键举措获得发展势头,以帮助公司更好地管理其混合云和多云支出。”

加速采用数据结构和数据网格

“在过去的二十年里,数据管理经历了集中与分散的循环,包括数据库、数据仓库、云数据存储、数据湖等。虽然关于哪种方法最好的争论有其自己的支持者和反对者,但过去几年证明,对于大多数组织而言,数据更加分散而不是集中。虽然部署企业数据架构有多种选择,但 2022 年加速采用了两种数据架构方法——数据结构和数据网格,以更好地管理和访问分布式数据。虽然两者之间存在内在差异,但 Data Fabric 是可组合的数据管理技术堆栈,而 Data Mesh 是面向分布式团队的流程导向,可以按照他们认为合适的方式管理企业数据。对于希望更好地管理数据的企业来说,两者都至关重要。轻松访问数据并确保其受到监管和安全,对每个数据利益相关者都很重要——从数据科学家到高管。毕竟,它对于仪表盘和报告、高级分析、机器学习和 AI 项目至关重要。

如果使用正确的数据基础架构进行适当构建,Data Fabric 和 Data Mesh 都可以在企业范围内的数据访问、集成、管理和交付中发挥关键作用。因此,到 2023 年,预计大中型企业对这两种架构方法的采用将迅速增加。”

提高数据质量、数据准备、元数据管理、分析

“虽然许多数据管理工作的最终结果是提供高级分析并支持 AI 和 ML 工作,但适当的数据管理本身对组织的成功至关重要。数据通常被称为新石油,因为基于数据和分析的洞察力不断推动业务创新。随着组织加速使用数据,公司必须密切关注数据治理、数据质量和元数据管理。然而,随着数据量、种类和速度的不断增长,数据管理的这些不同方面变得过于复杂而无法大规模管理。考虑数据科学家和数据工程师在开始使用数据之前花费在查找和准备数据上的时间。

根据一些顶级分析公司的说法,数据结构的每一层——即数据摄取、数据处理、数据编排、数据治理等——都应该嵌入 AI/ML,以自动化数据管理过程的每个阶段。到 2023 年,增强型数据管理将获得强大的市场吸引力,帮助数据管理专业人员专注于提供数据驱动的洞察力,而不是被日常管理任务所阻碍。

虽然这是我们认为的五个最重要的趋势,但还有其他数据和分析实践领域将影响数字业务在 2023 年及以后的生存和繁荣发展。过去两三年明确地告诉我们,当世界无法亲自见面时,数字业务并不是真正的后备选择,但这就是未来所在。希望您的组织在制定数字业务计划时可以从这些文章中获得一些见解。”


Nacelle 首席执行官 Brian Anderson

数据流成为工程焦点

“由于在线商务的显着增长,许多新的同类最佳供应商只专注于解决一个问题,并使该解决方案比开箱即用的单一平台提供的解决方案好 10 倍。这种趋势将对商家越来越有利,因为它允许他们组合一系列最能满足他们需求的解决方案。

如今,大多数供应商都提供 API,但具有前瞻性思维的 CTO 知道仅有 API 是不够的;进出单个最佳供应商解决方案网络的数据流成为成功的关键。到 2023 年,精明的架构工作将在这个分布式世界中实施最佳实践,数据规范化、事件重放、数据转换和抽象等工程模式将成为常态。”


蒙特卡洛首席执行官 Lior Gavish

数据合同

“旨在防止数据生成服务意外更改时上游发生的数据质量问题,数据合同非常流行。为什么?由于软件工程师所做的更改在不知不觉中通过影响下游数据管道的更新产生了影响,并且由于数据建模的兴起,数据工程师可以选择将数据交付到预先建模的仓库中。随着从业者尝试应用这些框架,到 2023 年将看到更广泛的数据合同采用。”

数据货币化

“在困难时期,数据团队比以往任何时候都面临更大的压力,需要将他们的工作与底线保持一致。数据货币化是数据团队直接与收入挂钩的一种机制。它还允许为产品添加数据洞察和报告,这是竞争日益激烈的市场中的差异化因素。”

基础设施即代码

“现代数据运营需要高度可扩展的云基础设施,但不断配置和维护这些服务可能既乏味又耗时。laC 允许数据工程师创建更加无缝的数据管道基础设施,更易于配置、取消配置和修改——这在预算紧张且人员有限的情况下至关重要。”

数据可靠性工程

通常情况下,不良数据首先被下游的利益相关者在仪表板和报告中发现,而不是在管道中——甚至更早。由于数据很少处于理想、完全可靠的状态,数据团队正在聘请数据可靠性工程师来部署工具(如数据可观察性平台和数据测试)和流程(如 CI/CD),以确保在问题发生时,它们会很快得到解决,并且在您的 CFO 发现之前将影响传达给那些需要知道的人。”


Fivetran 产品主管 Alexander Lovell

2023 年将为数据团队设置或关闭时间

“尽管回报质量差异很大,但公司仍保持对 IT 的投资。由于经济普遍存在混乱,现在是数据团队通过提供可操作的洞察力大放异彩的时候了,因为当市场不断变化时,高管的直觉就不那么可靠了。最好的数据团队将会成长并变得更加重要。无法生成可操作洞察力的数据团队将面临越来越大的预算压力。”

我们将看到公司更深入地了解云数据仓库成本

“关于总拥有成本的信息对于有效管理数据团队的成本至关重要,因为一次降低成本会破坏整个系统的效率。举证责任转移到数据团队,以证明总拥有成本的效率,以及数据洞察力正在为企业带来超额价值。”


Fivetran 首席产品经理 Meera Viswanathan

现代数据栈

“由于整个公司使用的工具太多,公司将寻求在 2023 年以更快的速度标准化他们的数据堆栈。此外,他们根据正确的数据做出决策至关重要——尤其是在收入等问题受到越来越多的批评的情况下。由于这些因素,数据信任和可见性将比以往任何时候都更加重要。” 

数据治理

“数据支持很重要,但到 2023 年数据治理可能会成为事后的想法——主要是因为治理通常是一项失败的举措,只有在需要时才被视为保险。最成功的企业将由那些使他们的数据团队能够快速、轻松地访问可信数据的企业来定义。

2023 年治理市场将更加标准化,元数据交换格式将被定义。”


Balaji Ganesan,Privacera 联合创始人兼首席执行官

数据安全

我们最近看到数据安全领域的许多新供应商都在寻求解决多项挑战;企业级公司拥有和使用的数据到底有哪些,哪些数据是(或不是)敏感数据,如何确保合适的人可以访问这些数据,以及如何确保他们遵守不断增加的法规。这没有放缓的迹象。”


Telm.ai 的联合创始人兼首席执行官 Mona Rakibe

数据质量

“如今,大多数公司的决策都由数据驱动,并采用现代数据架构来加速这一进程。随着这种转变,数据质量 (DQ) 的重要性也在迅速上升。DQ 已经开始成为自己的职能,产品经理处于这一职能的领导地位,带头完成提高数据价值的使命。为确保他们从第一天起就获胜,DQ 产品经理将数据质量与任何其他产品一样严格和标准。有一个 MVP 可以展示最高和最具影响力的价值,然后是渐进式进步。在最紧迫的问题上有持续的价值评估和数据改进的优先级,并且有适当的产品生命周期——设计、可用性、工程、质量控制、性能以及用户信任和采用。”


ZL Technologies 客户成功总监 Ryan Splain

公司数据文化

“随着‘悄悄辞职’和‘伟大的辞职’等术语在过去几年中越来越受欢迎,我们将看到雇主使用和分析员工数据的方式发生了决定性的转变。过去,雇主通常使用数据进行业务分析,但展望 2023 年,组织将有成熟的机会利用非结构化数据来了解员工情绪、工作场所文化和生产力水平,从而更好地了解生产力以及您当前员工的承诺。”

非结构化数据

“随着经济处于不断变化的状态,越来越多的组织正在寻求雇用基于项目的承包商或兼职员工。有了这个,组织就有机会利用非结构化数据来收集洞察力和信息,这些洞察力和信息对于根据具体情况做出支持目标的决策至关重要。非结构化数据揭示了无法从传统结构化数据源收集的员工数据的时间、空间和/或元素关系。这些信息将帮助组织了解全职员工与合同员工的绩效和生产力,并就招聘需求做出明智的决定(需要全职职位还是合同工等)。”


Collibra 联合创始人兼首席数据公民 Stijn Christiaens

拥抱数据文化的公司将获得最大的投资回报率

“随着数据领域继续呈爆炸式增长,企业更清楚地了解数据的价值,2023 年将是数据背后的人。换句话说,那些在 2023 年取得最大成功的公司将是那些完全拥抱数据文化建设、让更多人能够访问数据并在整个组织中优先考虑数据素养的公司。我们将开始看到更多的组织转向去中心化和民主化的数据方法。”


Collibra 首席技术官 Madalina Tanasie

数据网格将继续流行

“云采用的未来依赖于向数据网格架构的迁移。在过去的几年中,随着越来越多的组织希望分散数据并优先考虑域所有权,数据网格已成为企业技术中的一个有前途的趋势。进入 2023 年,我们将看到更多公司选择实施数据网格,以推动云采用并避免对应用程序性能造成干扰。”


Collibra 数据质量副总裁 Kirk Haslbeck

数据可观察性已列入最高管理层讨论的议程

“随着越来越多的公司开始将数据视为一种产品,我们将开始看到对数据民主化的重视,让组织中的每个人都能访问数据以帮助简化流程。出于这个原因,公司将开始对员工进行更正式的数据可观察性培训,重点关注数据质量,以确保数据在整个组织内都是最新的和相关的。”


Snow Software 产品营销总监 Jennifer Kuvlesky

适当的数据框架对于扩展 SaaS 产品至关重要

“我们将看到 SaaS 功能的持续扩展,或者公司收购功能以捆绑产品和集成以推动来年的扩展收入。但是,您需要有数据框架才能整合这些收购,并让这些功能协同工作。要有效地销售捆绑产品,您需要有效的数据和表示层来为客户简化。Salesforce 最近通过其新的 Salesforce 精灵数据层宣布了这一转变,以加快应用程序集成速度。

技术情报公司将寻求通过数据集成来实现这一目标,将数据孤岛整合在一起,为 IT 团队提供更多价值。我们在各个行业都看到了这一点,例如市场营销,那里有很多不同的应用程序,但由于数据没有集成,您无法从中获得价值。公司需要通过关联和集成他们的工具和数据来获得更多视角,从而使他们的投资对业务的其他领域更有用。”


Collibra 数字业务自动化总裁 Gur Steif

DataOps 采用

“在我们与大型企业的对话中,一个持续的挑战仍然是将复杂的数据管道有效地嵌入到关键的企业应用程序中,以改善客户体验。他们很难在生产中大规模地这样做,尤其是在复杂的混合云环境中。为了在来年改善数据驱动的应用程序和业务成果,组织将加速采用 DataOps 最佳实践,并继续投资于应用程序和数据工作流编排平台。为了获得他们想要的数据驱动的敏捷性,他们意识到必须让他们的运营和数据团队在安全、敏捷和操作稳健的框架内自由地交付创新。


Shireesh Thota,SingleStore 工程高级副总裁

开启统一数据库时代

“2023 年将是统一数据库的一年。统一数据库旨在同时支持大量事务和分析工作负载。这为公司处理大量工作负载提供了一个简化和灵活的数据架构。 

到 2023 年,我们将见证专业数据库的融合,这些数据库将建立在四个主要特征之上:分布式、无共享架构、云原生、多模型和关系基础。组织将需要一个平台来在混合、多云环境中以毫秒为单位处理和推理数据。

到 2022 年,许多受欢迎的供应商都朝着这个方向发展,并且在来年将会加快步伐。”

遗留数据库即将结束

“到 2023 年,遗留数据库将加速终结。随着世界朝着实时统一数据库的方向发展,速度已成为一个重要的区别因素,遗留系统无法再跟上我们在这个数字服务经济中看到的实时性。到目前为止,我们已经在金融等行业看到了这种趋势,但现在对于各行各业的商业领袖来说,数字革命开始于将公司凝聚在一起的技术堆栈:数据库。

我们正在迎来一个统一、简单、现代的实时数据时代。否则,您的公司可能不会看到 2024 年。”

分布式 SQL 得到更新和主流处理

“现在定义的分布式 SQL 将受到挑战。当前队列不包括实时、统一/HTAP 功能。随着关系和非关系的融合,不断增长的客户需求将迫使交易和分析能力大规模融合,这将成为分布式 SQL 的更好版本。这种趋势将不成比例地加速其他趋势!”


Datometry 创始人兼首席执行官 Mike Waas

SQL的返回

“我们看到 NoSQL 领域发生了重大变化。与之前拒绝一切 SQL 的主张相反,所有剩余的 NoSQL 数据库现在都渴望在其产品中添加 SQL 和类似 SQL 的语言扩展。2023 年很可能成为 SQL-Again 数据库之年。”


Jeff Tao,TDngine 创始人、CEO 和核心开发人员

传统行业开源数字化转型

“明年,开源和系统将变得更加重要。特别是,美国制造业等传统行业将寻求开放系统来重建基础设施,以变得更加现代化、更具成本效益和具有全球竞争力。开放系统将使传统行业不被传统供应商所束缚,并让他们掌握人工智能、机器学习、增强现实等尖端工具和技术的脉搏。它将消除数据孤岛,允许在内部或与外部合作伙伴轻松共享数据以进行更好的分析。 

我预测这种转变将以两种方式发生。首先,通过拥抱云。基于云的开放系统工程师将能够更轻松地共享数据,并充分利用现代数据处理、分析工具和云的弹性来降低运营成本。此外,通过采用开源项目使基础设施民主化将使制造和自动化等传统行业向更大的开发者社区生态系统开放。”


Tomer Shiran,Dremio 联合创始人兼首席产品官

随着传统提供商成本的上升,Snowflake 将成为一种利基技术

“到 2023 年,Snowflake 将变得更像是一种利基技术。根据他们的收益报告,随着 Snowflake 的成本平均每年增长 71%,客户已经到了无法再承受这种指数级增长的成本的地步。正因为如此,客户会对他们放在那里的东西更加谨慎,并且会竖起关于谁被允许使用和访问什么的批准和规则的墙。 

随着公司在这方面变得更加谨慎,他们将寻找开放的替代方案。使数据可访问并成为数据驱动的需求仍然存在,并且数据仍在快速增长。但是,客户需要能够大规模执行此操作的系统,并且客户需要它们具有成本效益。该行业正在朝着这些类型的系统发展。”

由于公司需要节省资金,昂贵的供应商锁定已经结束

“我们的预测是经济将在 2023 年进入衰退。因此,自然而然地,企业将对支出多少更加谨慎。公司还将寻找成本更可预测的解决方案。雪花是这两者的对立面,所以它会伤害他们。

此外,当使用像 Dremio 这样的开放数据架构时,您正在最大限度地减少您拥有的数据副本的数量。因此,您可以最大限度地减少需要的数据管道数量,从而极大地降低成本。所有公司都希望在其业务的各个方面提高效率,当然,数据基础架构的效率以及您进行分析的方式将成为其中的一部分。”

Lakehouses将接管并离开过去的仓库

“Lakehouse 技术的企业采用率正在飙升。我们看到很多公司都在拥抱开源、文件和表格格式。数据仓库会在一年内消失吗?我们不能肯定地说是,但趋势正指向那个方向。”


Percona 产品管理高级副总裁 Donnie Berkholz

数据所有权、主权和控制权将不断扩大

“关于数据隐私和数字主权的规则正在不断扩大。继 GDPR、CCPA 和欧盟关于数据隐私的规则之后,更多国家/地区采用了这些规则和法规来保护其公民。各国希望防止外国公司对数据进行过多控制。对于欧盟而言,这包括研究当美国公司有效拥有云计算市场时如何管理这一点,以及这对未来意味着什么。

对于必须跨地区和国家运营的企业来说,这是一个问题,因为他们将对可以和不能处理数据的地点有更多限制。开源数据库社区正在对此做出回应——例如,今年推出的 PostgreSQL 15 改进了逻辑复制,因此您可以设置数据的限制和地理围栏子集,从而将其限制在特定位置,并且不能在需要的地方复制。”

PostgreSQL 将继续接管世界

“PostgreSQL 作为一个项目和一个社区不断发展壮大。它最终将取代 MySQL 在 DB-Engines 排名中的位置,成为最受欢迎的开源数据库,但这还需要一段时间。有许多新项目正在启动,它们以 PostgreSQL 为基础,然后在上面提供它们的功能。

这样做的原因是让 PostgreSQL 做你想做的事很容易,而且它发布的许可证也使得在此基础上建立业务成为可能。对于用户来说,实施起来很简单,社区也很强大。”

数据库可靠性工程将卷土重来

“在过去五年站点可靠性工程取得成功之后,出现了将相同方法应用于数据库管理的趋势。然而,数据库可靠性工程 (DBRE) 并没有以同样的方式流行起来。对于许多公司来说,他们现有的数据库团队就足够了,或者他们想将他们的方法转移到云端。  

然而,DBRE 方法现在似乎又开始流行了。越来越多的人希望将这些经验应用到他们管理数据库实例的方式中,从而减少开销并提高弹性。Kubernetes 上数据库部署的增长在一定程度上促成了这一波新的兴趣,因此 2023 年对 DBRE 的需求应该会更多。”


Aerospike 首席产品官 Lenley Hensarling

实时数据

“尽管全球经济不确定,但随着对准确、全面、实时的业务视图的需求增加,实时数据将在 2023 年继续以 30% 以上的速度增长。企业将研究如何利用实时数据来降低风险并在利润和运营成本中找到更多价值。例如,金融机构每五分钟计算一次风险模型以了解如何驾驭变化,而不是每隔几个小时计算一次,这对于波动的全球经济至关重要。延迟响应可能会造成数百万美元的损失。 

使用实时数据降低风险将变得更加主流,并扩展到金融服务领域之外,以发现运营成本的更多价值。医疗保健和制造业等众多行业已经在日常运营中使用实时数据,但新行业将开始利用即时可用数据的收益来控制成本。”


Boomi 首席创新官 Ed Macosky

CIO 将依靠低代码来弥补技能短缺

“为了解决 IT 技能短缺问题,同时应对不断增加的成本控制压力,一些企业将采用低成本应用程序来满足利基需求,从而产生大量数据孤岛,从而导致质量和治理问题。为了解决这个问题,我们将看到更多的 CIO 与他们的 C-Suite 同行合作,并采用低代码 iPaaS/自动化工具来提供治理和安全性,同时仍然满足企业的需求。”


Boomi 首席工程官 Rajesh Raheja

CIO、首席数据官和数据经理将需要面对现代化的成本

“现代化和数字化转型涉及许多长期计划,例如将主要系统迁移到云端或不断集成现有数据和系统以满足业务流程需求。这些可能是高成本的举措,但在当今的数字世界中越来越必要。为了最大限度地降低这些举措失败的风险,高管们应该寻找方法来平衡他们的长期愿景与现代化的短期投资回报率,例如使用数据集成平台或自动化集成过程。”

数据驱动型企业将探索通过现代集成系统交付客户价值的新方法

“基于云的系统的激增和 SaaS 应用程序的增加将为数据驱动型企业创造大量机会。我们看到更多的数据法规和市场上物联网设备的爆炸式增长。这些因素将推动人们更加关注数据治理和数据驱动流程的新潜在用途,这将有助于满足消费者对定制、有针对性的服务日益增长的期望。”

软件工程将成熟以满足其他工程标准

“毫无疑问,软件正在吞噬世界;然而,构建软件的标准并没有达到其他行业的工程标准,例如制造业中使用的标准。随着软件越来越多地嵌入我们的日常生活中,例如汽车和飞机,它现在对人类生命的安全负责。这意味着将更加关注软件质量和设计流程、更成熟的 DevOps 和 DevSecOps 以及安全性。标准将不断发展,以提供完全透明的不仅是软件做什么,而且是如何做的。”


Direct 联合创始人兼首席执行官 Ben Haynes

混合“自带数据库”(BYODB) 云部署的兴起

“将某些数据驱动的项目迁移到云端的好处是毋庸置疑的——更快的部署、更低的基础设施和维护成本、内置支持和 SLA,以及在需要时即时扩展。但是,总会有一些用例义务要求将数据保存在本地,包括性能、安全性、合规性、本地开发和气隙硬件(仅举几例)。更灵活的解决方案是现代数据供应商除了更常见的本地和完全托管云服务选项之外,还支持混合“自带数据库”(BYODB) 云部署。这种新方法将在未来几年流行起来,允许数据保存在原地且不变,但远程连接到位于附近数据中心之上的 SaaS 服务。这提供了云的所有好处,

现代无代码和低代码解决方案将遵循自下而上的方法

“像 AirTable 这样的无代码和低代码平台在使公司数据民主化方面发挥了重要作用。然而,虽然它们为非技术业务用户提供了高度直观的外观,但它们的自上而下的架构对工程师来说非常有限或无法访问。虽然可以快速采用,但这些创可贴服务有一个未经考虑的后端,无法扩展,因此需要随着时间的推移而更换。在未来几年,现代 NC/LC 解决方案将采用自下而上的方法,奠定由强大的开发人员工具、高性能 API、定制数据存储和独立技术堆栈组成的基础数据层。如果不同时支持非技术用户和高技术用户,就无法实现真正的数据民主化。”

组织将致力于采用“中心辐射型”微服务方法

“毫无疑问,微服务方法在大多数方面都优于传统的单体架构。然而,庞大的微服务矩阵也有许多缺点。总体复杂性导致数据生态系统难以理解和维护,需要许多昂贵的许可证,并迫使用户培训和入职的学习曲线陡峭。这些微服务并没有完美地相互连接,留下了需要用自定义代码和逻辑来填补的能力差距——数据在不同的平台上孤立,集成也很脆弱。展望未来,组织将努力采用更加平衡的“中心辐射”方法(例如 他们将转向解决方案,这些解决方案奠定了涵盖业务需求的完整而坚实的数据基础(“中心”),同时仍与微服务集成以根据需要实现专业化)。这种更加平衡的解决方案将避免微服务复杂性的过度使用。”


Marinela Profi,SAS Software 数据科学家

数据管理 通过 AI 实现自动化

“我们继续看到组织努力跟上数据的速度和馈送,将 80% 的时间花在处理数据上,将 20% 的时间花在执行分析和建模上。在接下来的十年里,人工智能可以对克服信息过载产生的最大影响之一是通过自动化数据管理流程,这样客户就可以将 80% 的时间用于执行分析并将更多模型部署到生产中。”

Jay Upchurch,SAS Software 执行副总裁兼首席信息官

数据成为拥有自己生命的有机实体

“企业领导者会将数据视为具有生命周期的资产,以使数据网格环境中的数据民主化和数据产品化更加可行,从而创建有机且流动的数据肖像。数据将像库存一样被跟踪,同时考虑可能的数据产品化策略和将数据作为交付的最终产品的一个方面的机会。在任何时间点了解数据的形状和广度——无论是在部署软件包时还是在根据数据做出决策时——是现代软件用户所期望的。”

企业从传统数据仓库转向实时数据存储

“到 2023 年,我们将继续看到从传统数据仓库转向支持实时分析和响应数据的存储选项。组织将倾向于在数据可用时对其进行处理,并以用户友好的格式存储它以用于报告目的(无论是数据湖中的非规范化文件还是 DynamoDB 等键值 NoSQL 数据库中)。无论是监控来自机器的流式 IoT 数据的制造商,还是监控电子商务流量的零售商,能够实时识别趋势将有助于避免代价高昂的错误并在它们出现时利用机会。”


Immuta 联合创始人兼首席执行官 Matt Carroll

CISO 需要成为现代数据堆栈的推动者,而不是瓶颈

“数据从本地到云端的快速转移引发了迄今为止最大的网络安全挑战之一。尽管大多数 CISO 拥有一整套用于保护云中数据的工具,但 Snowflake、Databricks、Google BigQuery、Amazon Redshift 和其他基于云的 SaaS 解决方案等云播放器的激增加速了数据共享的崩溃。适用于本地环境的传统方法无法跟上当今环境中必须监管、管理和保护的用户、数据源和策略数量的指数增长。 

因此,到 2023 年,我们将看到数据安全架构发生重大转变,迫使 CISO 卷起袖子,围绕这个崭露头角的“现代数据堆栈”实施控制。这将包括有效平衡访问和安全的适当访问控制、对商业智能的持续监控以及用于异常检测的数据科学活动。与此同时,我们必须改变对监控的看法——零信任无法使用传统方法,因为端点太多了。归根结底,现代数据堆栈中的监控必须不断发展以跟上数据的速度。”

数据处理协议 (DPA) 的兴起

“组织如何在本地系统中处理数据历来是一个非常受控的过程,需要大量的工程和安全资源。然而,使用当今的 SaaS 数据基础架构,跨部门、地区和公司共享和访问数据从未如此简单。考虑到这一点,并且由于数据本地化/主权法律的增加,关于如何访问、处理和报告数据使用的规则将需要通过合同协议来定义——也称为数据处理协议(政治部)。 

到 2023 年,我们将看到 DPA 成为 SaaS 合同和数据共享谈判的标准要素。组织处理这些合同的方式将从根本上改变他们构建数据基础设施的方式,并将定义数据的商业价值。因此,在 2023 年及以后全面采用 DPA 将符合数据领导者的最大利益。这些冗长的文件将很复杂,但 DPA 的数字化和法律团队的参与将使它们更容易理解和实施。”

无拷贝数据交换将占据主导地位

“到 2023 年,随着数据共享的持续增长,数据和 IT 团队难以跟上,无副本数据交换将成为新标准。随着组织将其现代数据堆栈产品化,数据集的规模和数量将出现爆炸式增长。在共享之前制作副本将不再可行。到 2023 年,企业将涌向 Snowflake 的 Data Exchange 和 Databricks 的 Delta Sharing 协议等成熟平台,以更轻松地安全地共享数据并从中获利。”

Sophie Stalla-Bourdillon,Immuta 的高级隐私顾问和法律工程师

获取数据并不一定意味着能够获得有用的见解

在这场数据洪流中,成功的组织将是那些能够通过利用访问控制和混淆等自执行策略以及审计功能来破解数据治理困境的组织,以期缩短数据处理时间。他们将通过让数据所有者成为关键参与者来放弃毫无意义的预批准工作流程和联合数据治理:数据所有者将既是领域专家又是数据管理员。”

基于云的数据分析成为主流

“数据驱动的组织释放资源来建立可信或安全的分析环境,以防止数据泄露并降低合规风险。虽然 COVID-19 大流行加速了将医疗保健数据引入安全分析环境的速度,但其他垂直行业也将迅速走上类似的道路。处于这一举措前沿的组织将构建多云数据分析环境,并且必须抽象或联合其治理层以充分治理多个位置的数据。”


Starburst 数据产品主管 Vishal Singh

未来是去中心化的,敏捷性和协作将是关键

“尽管过去几十年尝试将数据存放在一个中央位置,但现实情况是数据仍然是分布式的,并且将继续存在于不同的区域、云、域和/或业务单元中。那么,组织如何在提倡集中式策略但分布式数据才是现实的环境中取得成功呢? 

到 2023 年,敏捷性和协作将成为去中心化数据管理成功的关键。成功的组织将通过使数据驱动的见解能够在整个企业内轻松策划和共享来实现。其中的一个基础组成部分将是广泛采用将数据视为产品的概念。

Data Products 提供了一个自助服务组件,使他们能够填补数据创建和使用之间的空白,而不是需要去其他地方回答他们可能对正在使用的数据提出的问题。在来年,我们将看到更多组织为数据访问民主化和/或通过数据产品加强其数据网格框架奠定基础。”


Monte Carlo联合创始人兼首席技术官 Lior Gavish

数据合同

“旨在防止数据生成服务意外更改时上游发生的数据质量问题,数据合同非常流行。为什么?由于软件工程师所做的更改在不知不觉中通过影响下游数据管道的更新产生了影响,并且由于数据建模的兴起,数据工程师可以选择将数据交付到预先建模的仓库中。随着从业者尝试应用这些框架,到 2023 年将看到更广泛的数据合同采用。”

数据货币化

“在困难时期,数据团队比以往任何时候都面临更大的压力,需要将他们的工作与底线保持一致。数据货币化是数据团队直接与收入挂钩的一种机制。它还允许为产品添加数据洞察和报告,这是竞争日益激烈的市场中的差异化因素。”

基础设施即代码

“现代数据运营需要高度可扩展的云基础设施,但不断配置和维护这些服务可能既乏味又耗时。laC 允许数据工程师创建更加无缝的数据管道基础设施,更易于配置、取消配置和修改——这在预算紧张且人员有限的情况下至关重要。”


Ocient 的联合创始人兼首席执行官 Chris Gladwin

超大规模将成为主流

“数据仓库供应商将开发新的方法来构建和扩展系统和服务。一些领先的 IT 组织现在正在处理包含数十亿和数万亿条记录的数据集。到 2023 年,我们甚至可以在广告技术、电信和地理空间等数据密集型行业中看到千万亿行的数据集。随着组织近乎实时地利用来自运营、客户以及移动设备和对象的不断增加的数据量,超大规模数据集将变得更加普遍。”

管道将变得更加复杂

数据管道是数据从其原始源进入数据仓库的方式。有了如此多的新数据类型——以及不断涌入的数据——这些管道不仅变得更加重要,而且可能变得更加复杂。到 2023 年,用户应该期待数据仓库供应商提供新的更好的方法来提取、转换、加载、建模、测试和部署数据。供应商将专注于集成和易用性。”

数据复杂度会增加,而数据分析会持续

下一代云数据仓库必须是多功能的——能够原生支持多模式数据,以确保它们处理的工作负载的性能和灵活性。需要分析新的和更复杂的数据类型,包括半结构化数据。长期以来,技术战略家一直在寻求利用实时数据进行业务决策,但架构和系统的局限性使这成为一项挑战,如果不是不可能的话。物联网传感器网络、机器人自动化和自动驾驶汽车等新兴用例正在生成越来越多的实时数据,需要对其进行监控、分析和利用。”


Zilliz 运营总监 Frank Liu

矢量数据库抓住机会释放未开发的非结构化数据的价值

“随着企业拥抱人工智能时代并试图充分利用其在生产中的优势,非结构化数据的数量出现了显着飙升,这些数据采用各种需要理解的形式。为了应对从非结构化数据中提取有形价值的这些挑战,矢量数据库——一种专为非结构化数据处理而构建的新型数据库管理技术——正在兴起,并将在未来几年占据一席之地。”

结构化和非结构化数据之间的协同作用

“尽管非结构化数据呈指数级增长,但结构化数据在未来仍将具有巨大价值。组织几乎不可避免地同时处理结构化和非结构化数据以实现最大的业务增长。 

现有解决方案最初设计用于处理传统数据分析的结构化数据,可以通过插件将其处理能力扩展到非结构化数据,例如 ElasticSearch 8.0 中的“原生向量搜索”和 Redis 6.0 中的“向量相似性搜索”。对于以密集非结构化数据着称的 AI 应用程序,这就是像矢量数据库这样的专用解决方案大放异彩的地方,辅之以支持基于标签、属性等过滤的混合搜索功能。”

异构计算是一个可以用来提高性能的地方 

“CPU 因其广泛认可的成本效率而成为现有解决方案的硬件。随着人工智能的普及,应用越来越多样化,在某些场景下对性能(高吞吐量)的要求越来越高,而GPU加速方案只能做到这一点。例如,Meta 的十亿级图像搜索和视频分析。”


Ascend.io 首席执行官 Sean Knapp

随着各种规模的数据基础设施供应商试图通过创新使自己脱颖而出,数据湖和数据仓库将融合

“我们目前正处于数据基础设施行业发展的难得时刻,因为用户越来越多地看到来自 Snowflake、Databricks 等主要参与者的竞争对等功能。反过来,随着供应商继续创新和差异化,从而实现更大的行业整合、互操作性和最佳实践的标准化。到 2023 年及以后,数据仓库、数据湖和其他类似的基础设施技术将出现显着整合,因为买家会筛选供应商和功能以找到其数据堆栈的最大价值,同时消除冗余以及构建和管理自己的定制平台的需要。 ”

目录和 MDM 等旧概念将重新出现并成为数据基础设施供应商的战场

“随着公司面临工具和元数据碎片化,将重新审视目录和主数据管理 (MDM) 等遗留企业规程。这些术语或它们的重新构想版本(例如“数据沿袭”)将重新流行起来,并将受到从 Amazon、Databricks 和 Snowflake 到初创公司的各种规模的数据供应商的积极拥护。到 2023 年,独立目录提供商将受益于意识的提高,但也将面临来自垂直整合产品的更激烈竞争。”

企业将逐步采用数据网格和结构

“虽然整个科技行业可能仍在争论什么定义了每一个(以及它们的区别),但组织之间不可否认的兴趣是获得这些特定架构的好处,即大规模的速度和敏捷性。在 2023 年和未来几年,虽然大多数数据团队将没有资源一头扎进使用新的网格或结构架构,但我们将看到他们逐步采用这些解决方案,通常首先通过定义新的最佳解决方案支持这些未来尖端架构的实践和策略。”

数据工程师的角色将继续沿着专业化的道路前进

“在过去的几十年里,我们看到软件工程师的角色分裂为各种其他角色,例如基础设施、后端、前端、移动,甚至产品工程师。数据工程师的角色将遵循类似的路径,我们不仅会看到今天的“数据工程师”(即全栈工程师)的持续增长,还会看到“分析工程师”(即前端工程师)的扩展,如以及“数据平台工程师”(即基础设施工程师)。这种专业化将使组织能够利用更多的人才和技能,并使工作与其开发人员最感兴趣的内容保持一致。”

随着团队厌倦集成,开发人员平台将取代松散连接的工具

“虽然只有少数参与者继续主导数据基础架构堆栈(Snowflake、Databricks 和三大云),但企业一直在使用大杂烩的工具上层堆栈来完成数据摄取、转换、编排、管理和可观察性等任务。到 2023 年,企业将达到临界点,因为他们厌倦了组装和管理这些 upstack 工具,并且看不到这些投资的足够回报。随着他们对碎片化模型固有的低效率越来越沮丧,企业将开始整合他们的供应商工具,以便优先考虑开发团队的生产力和易于维护。”


Cohesity 首席信息安全官 Brian Spanswick

安全、数据管理和存储

“当我们思考 2023 年的数据安全、数据管理和存储行业时,两个主要趋势将是更加关注预防和减少勒索软件等网络攻击的影响。市场条件和预算将继续变化,并将更加强调采用现代平台解决方案的必要性,为数据安全和管理提供最具成本效益和效率的策略。”

数据安全

“网络安全和数据安全对组织来说将变得更加重要,从而导致数据安全、网络安全和数据管理的融合。这三个领域的融合对于打击勒索软件等日益复杂的网络攻击是必要的。这些领域的领导者将合作并构建人工智能驱动的集成解决方案,为客户提供端到端的安全性,以帮助防止违规。”


Quest Software 高级解决方案策略师 Danny Sandwell

新的数据主权法将促使企业提高数据的可见性和互操作性 

“我们希望看到企业在当前的监管行动浪潮中在制定自己的数据治理政策方面发挥更积极的作用。当前全球错综复杂的数据主权和隐私法使企业比以往任何时候都更加复杂地制定关于数据共享、集成和合规性的一致政策。这将继续对组织在其 IT 基础设施中最大限度地利用数据的能力产生重大影响,除非他们制定明确的数据集成和治理计划。到 2023 年,更多数据主权和共享法律的通过将刺激企业投资以获取其数据的可见性,并制定明确的计划以在其 IT 环境中共享和集成。”


Rapid 首席执行官 Gino

API 将推动数据民主化

“API 使调整、转换、丰富和使用数据变得容易——传统上需要数百名高薪工程师来管理数据,并且需要数据科学家来理解算法。到 2023 年,我们将看到向管理数据的 API 技术转变,以此作为获得洞察力和控制数据相关成本的一种方式,这意味着人们将不再需要拥有高度发达的工程技能来利用数据的力量。”


Hillery Hunter,云行业平台和解决方案总经理;IBM Cloud 首席技术官

为不断发展的法规和数据主权做好准备

“随着组织努力满足当今数字优先客户的需求,他们正在以前所未有的速度实现现代化。但与此同时,他们需要在创新与不断增长的监管要求和数据主权法律之间取得平衡。随着 DORA 等监管要求在全球范围内升温,合规性将成为未来一年商业领袖的首要考虑 - 对于金融服务和处理客户个人信息等受到高度监管的行业的人来说,他们的担忧会更大。事实上,根据 IBM 最近的一项研究,超过一半的业务和技术领导者认为确保云中的合规性太难了。

随着全球勒索软件威胁的增长保护数据

“随着组织努力满足当今数字优先客户对即时满足的需求,他们还需要领先于不断增长的勒索软件威胁。虽然确保平台和服务易于客户使用很重要,但更重要的是要确保它们无法被想要访问敏感财务数据或希望勒索数据的坏人入侵。到 2023 年,找到平衡将成为企业的关键 –

尤其是那些在高度监管的行业——实现现代化并努力降低第 3 方和第 4 方风险。因此,我们将看到更多组织采用旨在处理其最关键任务工作负载并确保数据受到保护的业务转型战略,尤其是通过 cybervault 技术。”

Beyond Limits 数据科学总监 Michael Krause

被遗忘数据的命运

“随着行业优先考虑可持续性,我们已经看到 Snowflake、AWS 和 Databricks 等公司出现了更好的数据管理趋势,这种趋势将在 2023 年得到加强。许多公司没有投资于良好的数据管理实践和底层 IT 基础设施,因此无法很好地利用 AI 技术。为了加速数字化转型,企业将寻求采用能够为他们自动管理大部分数据价值链的平台。”


Teradata 产品工程高级副总裁 Dan Spurling

数据缩减

“数据量呈指数增长,但我相信我们会看到解决方案的兴起,这些解决方案可以从收集到的整体数据中推断出有意义的数据位,甚至可以使用超越当前经典数据存储技术的新技术来减少数据的足迹”


文章来源:https://solutionsreview.com/data-management/data-management-predictions-from-experts-for-2023/



「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论