暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据要素产业链很长,投资机会在哪?入围数据要素产业图谱企业271家;时序数据库HoraeDB开源孵化;IBM23亿美元收购···

220







新闻速递


本周热点
1.2023北京软件企业核心竞争力评价报告出炉,星环科技凭借大数据、人工智能等技术入选核心竞争力企业
2.中国信通院首发《数据要素产业图谱1.0》,271家企业入围
3.数据要素核心龙头,毛利率超70%,深度绑定英特尔,成长逻辑强硬!

大数据
4.中国信通院发布《2023大数据十大关键词》,湖仓一体、增强分析等入围
5.上海数据交易所公布“2023数据要素市场十大关键词”
6.Dremio Cloud为Microsoft Azure带来开放的湖仓一体方案
7.Apache StreamPark 2.1.2 Release版本正式发布,流处理应用体验更好
8.SingleStore上了Snowflake,为 Snowflake 原生应用推出混合矢量和全文搜索功能
9.IBM将以23亿美元收购数据集成平台webMethods和StreamSets
10.Qlik收购Mozaic以通过数据产品目录体验提供增强的业务价值

数据库
11.TuGraph开源高性能原生图存储系统CStore
12.时序数据库HoraeDB正式加入Apache孵化器
13.一库多用、一专多能,瀚高数据库管理系统V9.0发布
14.阿里云RDS PostgreSQL支持PG 16版本,AliPG提供丰富自研能力

数据安全
15.开箱即用!360数据安全检查工具箱正式发布
16.云原生智能变更防控AlterShield v1.0发布
17.物联网安全初创公司 Phosphorus 筹集了2700万美元用于研发
18.Okta以1亿美元收购身份安全初创公司Spera

AI
19.星环科技入选2023年中国AIGC创新企业榜单
20.数据库将驶入AI快车道,阿里云开源全新技术PilotScope
21.AI原生数据库Infinity开源,满足未来大模型对企业内部数据基础设施的需求
22.基于浪潮海岳大模型的智能对话平台2.0全新发布
23.折射OpenAI新一年技术路线图,透视Sam Altman的12个愿望清单







本周热点



1.2023北京软件企业核心竞争力评价报告出炉,星环科技凭借大数据、人工智能等技术入选核心竞争力企业


近日,北京软件和信息服务业协会发布《2023北京软件企业核心竞争力评价报告》,评价分为平台赋能型、技术研发型、市场应用型和业务探索型等4大类型。星环科技北京子公司凭借在大数据、人工智能等领域的技术实力及综合竞争力入选“2023北京软件核心竞争力企业(业务探索型)”。


星环科技自成立之初就坚持自主研发与技术创新,已形成大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵,积累了31 项核心技术,为推动数字经济发展持续贡献力量。


2.中国信通院首发《数据要素产业图谱1.0》,271家企业入围



中国信通院正式发布《数据要素产业图谱1.0》,共展示了271家典型单位,围绕数据要素价值驱动企业、数据要素服务机构、数据要素技术厂商三大版块进行梳理。星环科技入围数据存储与计算厂商、数据安全厂商、数据治理厂商、数据流通厂商、数据分析应用厂商等。


其中,数据要素价值驱动企业,以数据资源为基本载体,以数据价值释放为核心目标,参与数据生成、流通、增值利用的企业。


数据要素服务机构,不直接参与原始数据开发利用,为数据流通提供专业第三方服务的机构。


数据要素技术厂商,为数据要素开发利用各环节提供技术实施、技术平台、技术服务等能力的厂商。


3.数据要素核心龙头,毛利率超70%,深度绑定英特尔,成长逻辑强硬!


数字经济时代,数据就是“原材料”,是高度信息化下新的生产要素。随着数据要素相关政策出台,数字经济的不断深入,数据要素势必会获得更加广泛的关注。


工信部数据显示,数据要素对当年GDP增长的贡献率和贡献度在2021年分别为14.7%和0.83个百分点,而且对当年GDP增长的贡献率呈现持续上升状态,对社会经济产生的影响日益突出。


数据要素的使用具有放大、叠加和倍增的作用,推动生产方式、生活方式和治理方式的全面变革,根据工信部测算,2025年将突破1749亿元,“十四五”期间我国数据要素市场规模复合增速将达到26.3%,整体上进入高速发展阶段。



数据要素的产业链非常长,核心是中游的数据的资源化和下游的数据价值化,产业链上游和下游的主体其实是一样的。


数据要素产业链中游主要包括采集、存储、加工、分析、确权、定价以及流通交易环节。其中存储、加工、交易、分析环节市场相对成熟,2021年市场规模超百亿。确权与定价主要涉及相关区块链的建设,日前市场规模较小。







大数据


4.中国信通院发布《2023大数据十大关键词》,湖仓一体、数据资产化、增强分析等入围


在2023大数据产业发展大会上,中国信通院发布了《2023大数据十大关键词》。



数据从计算机语言到成为生产要素的全生命周期包括以下七个环节,数据资源化、数据治理、数据资产化、数据开发应用、数据流通、数据要素市场建设、数据安全。今年的十大关键词中有四项分布于数据开发应用环节,两项分布于数据要素市场环节,两项分布于数据安全环节,体现出了今年发展的重点在于数据的业务赋能与内外部融通,以及继续夯实安全基础。


5.上海数据交易所公布“2023数据要素市场十大关键词


上海数据交易所总结出数据要素市场年度十大关键词,藉以回顾过去,展望未来。


数据基础制度。2023年,为贯彻国家“数据二十条”,多部门、多地方、多措并举推进数据要素市场的基础制度建设。


国家数据局。2023年3月,国务院机构改革方案中提出组建国家数据局的方案。10月25日,国家数据局正式揭牌,成为推动中国数字经济和数据要素市场发展的里程碑事件。


公共数据开发利用。公共数据是我国数据要素中最重要的资源,规模海量、数据质量高,蕴藏着巨大的经济和社会价值。公共数据的开放和开发利用,是我国数据要素市场建设的关键突破口。


数据跨境流动。根据麦肯锡的数据,2014年,数据跨境流动为全球经济贡献2.8万亿美元的产值,而这一数额在2025年将到达11万亿美元,由此可见数据跨境流动对全球经济的重要性。


数据基础设施。数据基础设施是从数据要素价值释放的角度出发,在网络、算力等设施的支持下,面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、开源协议、标准规范、机制设计等在内的有机整体。


数据交易链。作为数据基础设施的重要实践和标志性事件,数据交易链在2023年11月正式宣布启用。数据交易链面向数据要素流通市场全产业全流程,提供数据交易基础服务、数据交易增值服务、数据交易保障服务、数据资产金融服务等。


数商生态。2023年,数商生态进一步壮大并获得政策上的支持。


数据要素×。随着“数据要素×”行动的启动,将大幅拓展应用场景的广度和深度,推动数商生态和数据产业的发展,提升数据流通交易的规模。


数据资产入表与估值。“数据二十条”中明确提出探索数据资产入表新模式。在2023年,这一政策即落地发布,成为数据要素领域最受广泛关注的话题之一。


数据资产通证化。数据资产通证化不仅能够促进数据流通和共享,还能为企业提供更多融资渠道,是数据资产创新应用的重要方向,其所带来的通证经济有望成为我国经济增长的新亮点和新引擎。


6.Dremio Cloud为Microsoft Azure带来开放的湖仓一体方案


Dremio是一个简单且开放的数据湖仓一体解决方案企业,目前在Microsoft Azure推出 Dremio Cloud的公共预览版,该SaaS解决方案基于Apache Arrow的列式基础构建,将自助式分析与数据仓库功能和数据湖敏捷性相结合,以推动数据价值并降低总体成本。


据Dremio称,其原生列式云追逐(C3)可在Azure Data Lake Storage(ADLS)上实现无与伦比的吞吐量和快速响应时间。与Dremio的分析查询加速器(称为 Reflections)配合使用,该解决方案可以为BI工作负载提供亚秒级响应时间。(.dbta.com


7.Apache StreamPark 2.1.2 Release版本正式发布,流处理应用体验更好


近日Apache StreamPark(Incubating) 社区正式发布了 StreamPark 2.1.2 版本,在 2.1.2 版本中,支持了最新的 Flink 1.18,Flink Jar 类型的作业支持指定依赖,修复了诸多 Bug 、完成了大量改进,进一步提升了稳定性和可用性,建议所有用户升级到这个版本。


Apache StreamPipes 2.1.2版本的发布意味着修复Bug、改进性能、增加新功能、提高兼容性、推动社区发展和增强安全性。


StreamPark是一个流处理应用程序开发管理框架。初衷是让流处理更简单,旨在轻松构建和管理流处理应用程序,提供使用 Apache Flink 和 Apache Spark 编写流处理应用程序的开发框架。同时 StreamPark 提供了一个流处理应用管理平台,核心能力包括但不限于应用开发、调试、交互查询、部署、运维、实时数仓等。


8.SingleStore上了Snowflake,为 Snowflake 原生应用推出混合矢量和全文搜索功能


SingleStore宣布其产品SingleStoreDB将为Snowflake数据云中应用提供矢量化和执行混合搜索等功能,成为用户生成式 AI 应用程序的一部分,而无需在 Snowflake 治理边界之外移动或复制数据。


此集成利用 Snowflake原生应用程序框架和Snowpark 容器服务,使组织能够在其 Snowflake账户中安全地部署 SingleStoreDB。(datanami.com


9.IBM将以23亿美元收购数据集成平台webMethods和StreamSets


IBM宣布,已与 Software AG 达成协议,以 23 亿美元的价格收购 Software AG 的 Super iPaaS(集成平台即服务)企业技术平台 webMethods 和 StreamSets。


IBM计划以21.3 亿欧元(约合 23.3 亿美元)现金收购Software AG的StreamSets和 webMethods 应用程序集成平台。


总部位于德国 Software AG于2022年初通过对初创公司的收购获得了 StreamSets 。这是一个iPaaS 平台,可帮助公司在应用程序之间移动信息。例如,零售商可以使用StreamSets将销售日志从本地数据库传输到Snowflake环境。


StreamSets支持多种数据传输方法。它可以在创建记录后立即将记录实时流式传输到目标系统,也可以按设定的时间间隔批量发送它们。StreamSets 还提供了一个所谓的变更数据捕获工具,用于在存储在不同系统中的业务记录副本之间同步编辑。


IBM从Software AG购买的另一款产品webMethods也是为类似的任务而设计的。它可以帮助公司自动在内部系统之间传输数据。Software AG于2007年以5.46亿美元的价格收购了最初开发该平台的互联网时代公司,从而获得了webMethods。


IBM表示,它将使用StreamSets和webMethods来扩展其watsonx产品套件的功能。(今日头条)


10.Qlik收购Mozaic以通过数据产品目录体验提供增强的业务价值


数据集成和分析提供商 Qlik 正在收购 Mozaic Data (Mozaic),这是一种创新的 AI 驱动的数据管理技术,标志着在简化企业数据处理方面取得了进步,专注于以数据产品为导向的方法,以提高数据质量和治理。


根据 Qlik 的说法,将 Mozaic 集成到 Qlik 的产品组合中,为将数据作为产品进行管理带来了变革性的方法。


此次收购将加速企业之间的数据部署和利用,特别是在Amazon Redshift、Databricks、Google BigQuery、Microsoft Fabric和Snowflake等云平台中。


据该公司称,通过此次收购,Qlik 加强了其提供端到端数据解决方案的承诺,无缝集成了 Mozaic 的技术,以增强企业的整体数据消费体验。(dbta.com







数据库


11.TuGraph开源高性能原生图存储系统CStore


TuGraph开源高性能原生图存储系统CStore。CStore已在蚂蚁集团内部具备多年大规模生产化经验。目前,CStore系统已全部开源到TuGraph Analytics仓库(geaflow-cstore模块),未来将不断迭代升级,提升系统性能。


CStore是一款专门为图分析场景而设计的原生图存储引擎,它采用了Rust语言编写,使用基于图的存储结构,针对图分析场景进行特定优化。CStore可以存储包含千亿级点和万亿级边的图数据,在蚂蚁集团内部的多场景使用中,已经积累了多年的经验,存储容量达到了PB级别。


12.时序数据库HoraeDB正式加入Apache孵化器


蚂蚁集团时序数据库CeresDB于2022年6月宣布开源。2023年12月11日,蚂蚁集团将 CeresDB的核心源代码以 HoraeDB 的品牌捐赠给Apache Software Foundation (ASF) 。根据 Apache 基金会邮件列表中显示,HoraeDB以13个约束性投票(binding votes)和1个无约束性投票,无弃权和反对票通过投票决议,官宣正式加入Apache孵化器。


加入 Apache 孵化器后,HoraeDB 将积极践行『开放、协作』 的 Apache 之道(The Apache Way),保持开放治理,持续构建一个公平、多元、包容的社区,遵守 Apache 孵化器的指导方针和流程,积极参与社区活动,努力推动项目的进展。


13.一库多用、一专多能,瀚高数据库管理系统V9.0发布


近日,瀚高基础软件股份有限公司推出瀚高数据库管理系统V9.0,全面兼容原生PostgreSQL功能及生态,并提供丰富的自研Oracle兼容特性,内置数据类型、函数、存储过程、匿名块、包、全局临时表等。系统基于插件式体系架构设计,支持参数化实例方式,采用多语法解析器架构,满足用户“一库多用”需求,通过多端口访问机制,支持一套瀚高数据库同时接入Oracle、MySQL和SQL Server,方便用户统一选型,统一运维。


瀚高数据库管理系统V9.0是面向企业客户,精心打造的一款拥有完全自主知识产权、面向核心交易型业务处理的企业级关系型数据库,可为政府、金融、电信、交通、能源等重点行业和领域的各核心业务应用带来业界领先的性能。瀚高数据库管理系统V9.0全面扩展了企业级核心业务数据库功能特性,高可用性、安全性及易用性等也得到显著增强。


14.阿里云RDS PostgreSQL支持PG16版本,AliPG提供丰富自研能力


今年9月,官方发布PostgreSQL 16.0,在性能、逻辑复制、开发者体验、监控、权限&安全等方面进行了改进和优化。作为商业化的数据库产品,针对特定用户场景的业务需求,社区版PostgreSQL 16.0在安全、成本、可运维性等方面仍有可提升空间。


阿里云数据库RDS PostgreSQL版的自研内核AliPG在社区16.0基础上,在安全、成本、可运维性等方面提供了不少自研能力,新增了多种内核/插件特性,用以满足用户特定业务场景的需求。


同时,AliPG还集成了众多自研和三方插件,为用户提供丰富的扩展功能,包括:Ganos时空引擎(自研)、全密态数据库(自研)、index_adviser索引推荐(自研、oss_fdw读写外部数据文本文件(自研)、pgbouncer轻量级连接池(三方开源)、pg_jieba中文分词插件(三方开源基础上加入自研功能)、pgvector向量插件(三方开源)等。






数据安全


15.开箱即用!360数据安全检查工具箱正式发布


基于多年实战经验,360构建“看见+处置”为核心的数字安全运营服务体系,打造数字安全中国方案。基于这套方法论,为助力政企单位开展数据安全检查工作,360正式推出一体化便携式检查专用设备——360数据安全检查工具箱,面向数据安全风险评估场景,提供数据安全检查管理系统及配套技术检查工具,帮助政企单位快速开展高质量数据安全合规性分析,实现资产可视、风险可知、行为可管。


360数据安全检查工具箱支持即插即用,内置权威检查知识库,全面覆盖数据安全从管理到技术的检查需求,系统预设检查流程和操作指引,新手也可以完成规范化数据安全检查。用户只需将工具箱接入目标网络即可进行技术检查,无需复杂配置,不用额外部署探针、引擎,在保障检查效率的同时也确保检查对象的安全性。


16.云原生智能变更防控AlterShield v1.0发布


AlterShield 是一款能够有效进行变更风险防控,预防变更引发生产环境故障的变更管控解决方案。它是蚂蚁集团内部变更管控平台 OpsCloud 的开源版本。


现在,AlterShield v1.0发布,目前AlterShield主端已经提供一个完整可运行的版本。


它凝聚了蚂蚁集团在公司大规模变更下积累的变更管控技术、产品以及方法论。在复杂业务场景下,提供变更过程中的生命周期感知、变更防御、变更熔断能力。siliconangle.com


17.物联网安全初创公司 Phosphorus 筹集了 2700 万美元用于研发


物联网安全初创公司 Phosphorus Cybersecurity Inc宣布已经筹集了2700 万美元的新资金,以扩大其网络物理系统保护平台的研发和市场推广。



Phosphorus 成立于 2017 年,提供United xTended 物联网安全管理平台,用于统一安全和设备管理。该平台的使命是帮助企业“管理不可管理的资产”,为各种信息物理系统资产(包括超过100万个独特的xIoT模型)提供完整的发现、修复和安全管理。xIOT设备包括广泛的信息物理系统,涵盖物联网、运营技术、工业物联网和嵌入式医疗设备。


据称,统一xIoT安全管理平台将为每个垂直行业提供无与伦比的安全管理和漏洞预防,以提供发现和风险评估。该平台还提供主动强化和修复,以及持续监控和管理。(siliconangle.com)


18.Okta以1亿美元收购身份安全初创公司Spera


Okta宣布将收购Spera Cybersecurity ,一家帮助企业保护Salesforce和GitHub 等服务的员工账户的初创公司。


这笔交易的价值将在1亿至1.3亿美元之间,具体取决于是否达到某些业绩里程碑。在纳斯达克上市的Okta提供处理发送到其应用程序的登录请求的软件。


在过去的几个月里,它一直在努力扩大其在相关市场的影响力,Gartner将其称为ITDR,即身份威胁检测和响应细分市场。该研究公司预计,到2026年,企业对此类软件的采用率将从目前的5%至20%扩大到90%,这意味着该细分市场可能成为Okta收入增长的新来源。







AI


19.星环科技入选2023年中国AIGC创新企业榜单


近日,国内知名的科技产业研究平台“第一新声”联合天眼查发布了2023年中国AIGC创新企业系列榜单,星环科技成功入选其AIGC数据层创新企业榜。


作为一家企业级大数据基础软件开发商,星环科技致力于为行业提供大模型应用构建的一系列工具,以及在擅长的领域研发领域基础大模型,助力企业抓住大模型时代的新机遇。


星环科技推出了机器学习模型全生命周期管理的工具平台Sophon LLMOps,支持从数据接入开发、提示工程、大模型微调、上架部署到应用编排和业务效果对齐的全链路流程,结合自研向量数据库Hippo 和分布式图数据库 StellarDB,能够赋予大模型“长期记忆”, 打破通用大模型的时空限制,用户可以快速便捷地构建深谙企业自有专业领域知识的垂直行业大模型,从而让每个人都拥有个性化AI助理。


同时星环科技还推出了无涯金融大模型Infinity、大数据分析大模型SoLar“求索”两大领域大模型,促进金融分析和大数据分析的平民化。


20.数据库将驶入AI快车道,阿里云开源全新技术PilotScope


阿里云推出新技术平台PilotScope,可实现AI算法在数据库的“一键部署”,极大降低数据库中AI算法的应用门槛,为数据库智能化开辟了全新道路。同日,阿里云宣布将PilotScope全部技术免费开源。


PilotScope形容为数据库AI“超级管理员”,通过PilotScope平台,AI工程师只需专注于设计通用的AI算法,可实现对不同数据库的部署和应用;而数据库使用者可像调用API那样,方便又高效地用上AI。


21.AI原生数据库Infinity开源,满足未来大模型对企业内部数据基础设施的需求


AI原生数据库Infinity宣布开源。AI原生数据库,定义为专门服务大模型的数据库,其具体场景即为RAG(Retrieval Augmented Generation)。未来企业大模型应用架构的基础设施层面,将只需要一个AI原生数据库配合一个大模型,就可以完全满足企业对于AI场景的主要需求,包括Copilot、搜索、推荐、对话机器人等。来自企业内部的各种数据,比如文档、普通数据库(包括OLTP和OLAP等)、API、日志,还有非结构化数据,都可以集成进一个AI原生数据库;AI原生数据库将业务查询得到的数据喂给大模型,再由大模型生成最终结果返回给具体应用。


Infinity是一款结合AI基础设施和Data基础设施的产品,它面向的是在线场景,满足未来大模型对企业内部数据基础设施的一切需求。Infinity采用C++ 20标准开发,确保了最优的执行路径。在各种创新算法的共同加持下,Infinity在向量搜索性能上超越了所有已知向量数据库,在八核的机器和百万SIFT向量数据集上,高并发场景下Infinity可以轻松达到1万QPS,单个客户端场景下查询响应延迟则是0.1毫秒级,且内存占用小。


此外,Infinity 还引入了C++ Modules 提高开发效率,是最先采用 C++ Modules 的大型开源项目。这使得在普通个人笔记本上编译 Infinity二十万行代码及其依赖的上百万行C++代码的时间减少到数分钟。极大节约了传统 C++ 程序员因修改一行头文件,动辄要重新编译数百个文件,耗时十几分钟的痛点。


22.基于浪潮海岳大模型的智能对话平台2.0全新发布


浪潮通软基于浪潮海岳大模型全新发布浪潮海岳智能对话平台2.0,支持智能客服、智慧营销、智能招聘、智慧办公、智能开发等业务场景,应对企业数字化转型中对智能化的迫切需求。


浪潮海岳智能对话平台具备知识管理、技能管理、多轮对话、对话策略等核心功能,支持常见问题问答、文档问答以及任务型处理等多种对话能力,PC端、移动端多渠道接入,为用户提供专业、稳定、可控且更加符合业务场景需要的智能对话系统与解决方案。


浪潮海岳智能对话平台2.0具备新特性包括:浪潮海岳大模型加持、体系化知识管理、多模态智能交互、在线实时智能训练、多技能管理、多渠道接入等,支持移动端、网页端、小程序等多种应用渠道,全终端、全方位支撑应用智能化建设。


23.折射OpenAI新一年技术路线图,透视Sam Altman的12个愿望清单


当地时间 12 月 24 日,Sam Altman 在X 平台上罕见地发起了一个「许愿池」, 「希望 OpenAI 在 2024 年构建/修复什么?」,这条推文迅速吸引 AI 领域众多大佬和网友的参与。


两个小时后,Sam Altman 挑选了12 个期望值最高的愿望清单,并誓言 「我们将尽我们所能去提供(以及许多其他我们感到兴奋但此处未提及的内容)」——从这里可以折射出 OpenAI 2024 年的路线图。


·AGI(请保持耐心)


·GPT-5


·更好的语音模式


·提高访问限制


·更好的 GPTs


·更好的推理能力


·对觉醒/行为程度的控制


·视频处理/生成能力


·个性化定制


·更强的联网搜索能力


·使用 OpenAI 登录


·开源


新年伊始 元旦快乐

点击上方蓝字关注我们


END





文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论