暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

TD退出中国大量用户该怎么办?国产数仓风头正劲!湖屋发力湖仓一体;量化投研解放人力;开源数据库也要多模;数据确权、数据定价···

287







新闻速递


1.Teradata退出中国,您可以相信中国数据库!
2.星环科技ArgoDB助力农商行实现Teradata国产化替代,综合成效比提升14倍
3.数仓巨头Teradata退出中国市场!Tableau/Salesforce/Nutanix等巨头谢幕中国!
4.搜索型数据库首次标准研讨会举行,星环科技等企业参与标准制定研讨
5.艾瑞咨询发布《2022年中国大数据分析平台行业研究报告》,星环科技入选产业图谱
6.《2022 中国开源开发者报告·开源数据库》:多模、Serverless、云原生、融资热···
7.数据确权新机遇!首个上市公司数据资产登记凭证颁发
8.数据定价重大突破!全国首个数据产品交易价格计算器正式上线
9.StreamPark 2.0.0 重磅发布,首个 Apache 版本终于来了!
10.数据湖仓供应商Databricks为其湖屋Lakehouse平台增加新的开发工具
11.数据治理和安全服务商Privacera与Dremio LakeHouse集成,帮助企业完成数据治理
12.星环科技、财联社携手发布多模事件驱动量化平台
13.稳定可靠安全无忧,华为云发布代码托管服务CodeArts Repo
14.PingCAP Clinic诊断客户端Diag正式开源
15.高性能、实时的分析型数据库Apache Doris 1.2.2 Release 版本正式发布
16.微软2月修补了三个零日安全漏洞和77个补丁,SQL Server漏洞修复程序最多
17.微软宣布上调Bing Search API定价,费用最高增长1000%
18.荷兰黑客通过搜索引擎找到的配置错误的云数据库中窃取窃取了几乎整个奥地利人口的数据
19.「国民认证」 完成新一轮数千万元融资,推动强身份认证体系再升级
20.数据转换供应商DBT Labs收购Transform以增强语义层工具
21.工业大数据解决方案提供商「积梦智能」完成数千万人民币A轮融资








本周焦点




1.Teradata退出中国,您可以相信中国数据库!



2月15日,Teradata以对中国当前及未来商业环境的不确定性,慎重考虑后决定退出中国运营,后续将进入中国公司关闭程序。


Teradata是一家有着40多年历史的数据仓库企业,被业界专业人事称为“数仓人才的黄埔军校”, 在大数据领域一直保持全球领先的地位。它在1997年正式进入中国,并率先在金融、电信领域推出自己的数仓产品,由于当时国内软硬件基础不太好,信息化行业又面临着迅速数据膨胀等因素,在中国铺开市场。


那么,Teradata在国内众多的用户该何去何从?数仓的国产化替代刻不容缓。


从公开新闻可以看到,近年来新兴数据库厂商(如星环科技、 StarRocks)、传统数据库厂商(如南大通用、达梦)、云厂商(如阿里云、华为云) 等中国数据库厂商已逐步实现对 Teradata 等国外主流软件的成功替换,并积累了丰富的经验。上海银行、浦发银行、天津银行等正在或已经完成从 Teradata 数据仓库平台的迁移。




2.星环科技ArgoDB助力农商行实现Teradata国产化替代,综合成效比提升14倍



某农商行采用星环科技分布式分析型数据库ArgoDB建设了新一代湖仓一体平台,平滑替代了原Teradata一体机,实现了多数据平台合一,降低了原有同质化的数据系统运维开发成本和数据冗余,综合成效比达到Teradata的14倍。


自主研发的分布式分析型数据库ArgoDB经工信部电子第五研究所代码扫码测试,代码自主率(行数)超90%,可支持标准SQL语法,兼容Oracle、IBM DB2 和 Teradata 等方言,通过一个ArgoDB数据库,就可以打造一站式离线数据仓库、实时数据仓库、数据集市和联邦计算平台等数据分析系统,同时已与国内主流软硬件信创厂商完成了兼容适配互认证,满足信创验收要求。作为一款优秀的数据库产品,目前ArgoDB已在各行各业成功替代Oracle、DB2、Teradata等国外产品。




3.数仓巨头Teradata退出中国市场!Tableau/Salesforce/Nutanix等巨头谢幕中国!



近日,大数据分析/数仓软件巨头Teradata宣布基于中国未来商业环境评估,退出在中国的直接运营,后续将进入中国公司关闭程序,涉及1200多名中国员工!


Teradata天睿公司(纽交所代码:TDC),是美国前十大上市软件公司之一。经过逾30 年的发展,Teradata天睿公司已经成为全球最大的专注于大数据分析、数据仓库和整合营销管理解决方案的供应商。


在国内金融和运营商领域前些年Teradata占有率很高。而伴随着公有云的普及,云原生数仓领域越来越被关注,特别是股神巴菲特老爷子投资Snowflake.


大数据分析和数仓领域也是是国内TOB创业领域的网红,在信创背景下,留给Teradata等传统外资具体的空间确实不多了,股价反应了一切,如今的Teradata市值也只有Snowflake一个零头了!


另外,BI软件巨头Tableau退出中国直销市场。超融合小巨头Nutanix(路坦力)裁减中国团队,退出中国市场传闻迭起。CRM 巨头Salesforce解散中国直销团队。







产研报告




4.搜索型数据库首次标准研讨会举行,20多家企业参与标准制定研讨



中国通信标准化协会大数据技术标准推进委员会数据库与存储工作组(CCSA TC601 WG4)联合中国信通院数据库应用创新实验室(CAICT DBL)召开《大数据 搜索型数据库技术要求》标准首次讨论会。


会议由中国信通院组织,邀请了星环科技、阿里云等企业20余位相关专家,围绕标准框架进行了深入的讨论。


会议针对《大数据 搜索型数据库技术要求》标准的能力域和能力项划分方式进行了集中讨论,对搜索型数据库定义和标准的整体框架形成了初步共识。后续,项目组将会继续完善技术要求内容,推进标准的编制工作。




5.艾瑞咨询发布《2022年中国大数据分析平台行业研究报告》,星环科技入选产业图谱



报告的核心内容包括:


行业界定:大数据分析平台逐渐由产品态转向集成态,行业边界模糊。在技术架构上,主要包含数据采集与存储、计算、分析与决策三个层级。在OLAP之上融合了深度学习等技术,在提升数据分析深度和广度的同时,也极大地增加了数据服务在业务侧的低门槛和友好性,满足用户运用数据分析驱动业务发展的需求。


市场情况:尽管行业边界泛化,市场参与者众多,但按照部署模式、架构分类及能力补给,可分为以下五类:1)以云上数据湖方案为主的公有云厂商;2)以本地化大数据分析平台为主的传统软件服务商;3)提供轻量化数仓架构的数据库/数仓厂商;4)为数据应用层提供服务能力的软件供应商;5)提升数据应用能力的人工智能厂商。行业市场整体呈现竞合状态。


架构选型:搭建平台前用户首先需要明确自身的数据体量和业务场景需求。在明确大数据分析平台需要具备的基本功能后,再决定平台搭建过程中使用的大数据处理框架和工具。在分层架构中,数据分析层的组件选型和整体搭建十分关键,尤其是存储引擎的选型直接决定了离线、在线、实时三大场景的支撑和算力效率的高低。


趋势洞察:传统架构下的湖仓分体引发数据孤岛,造成实施、运维和成本问题。湖仓一体架构在数据和查询层面形成一体化架构,突破实时性和并发度、集群规模受限、非结构化数据无法整合、建模路径冗长、数据一致性弱等瓶颈。同时,平台融合AI 自主学习和自适应能力,增强用数人员的分析和决策能力。




6.《2022 中国开源开发者报告·开源数据库》:多模、Serverless、云原生、融资热···



OSCHINA和Gitee 联合发布了《2022 中国开源开发者报告》。其中 “前沿开源技术领域解读” 部分,多位在其领域有所建树的一线开发者和开源商业化公司创始人,对目前国内外流行的前沿开源技术领域过去的发展和未来的趋势进行了深入的洞察,覆盖开源云原生、开源 AI、开源大前端、开源大数据、开源DevOps、RISC-V、开源操作系统、开源数据库、编程语言九大领域。


而在开源数据库领域,主要趋势包括:


·在基础设施全面云化的变革中,开源数据库使得中国基础软件的发展与世界保持同步,甚至起到了部分引领的作用。


·开源数据库在这一年的发展异彩纷呈,分析型数据库、图数据库、时序数据库、向量数据库等各细分领域都相继涌现了头部玩家。


·开源数据库赛道持续引领基于开源项目创业的融资热潮,并且多集中于早期阶段。


·数字能源产业升温,多模数据库或将流行。如果未来可以搭建一套多模数据库,统一提供时序、HTAP、消息等各种能力,可能会是解决现实问题的一个有效的选择。


·围绕云原生技术,开源数据库在云化、平台化、一体化、智能化四个方向上全面发展,企业级能力持续增强。


·Serverless化即将成为数据库的下一个变革性技术。云数据库在朝着 Serveless的方向演进,数据库技术在云资源抽象、封装、归一、统一调度能力上取得了巨大进步。




7.数据确权新机遇!首个上市公司数据资产登记凭证颁发



北京国际大数据交易所发出了首个上市公司《数据资产登记凭证》。获得该凭证的是科创版上市公司罗克佳华科技集团股份有限公司(简称佳华科技)。


据佳华科技官网消息,经过严格专业的评审,佳华科技凭借《环境大气质量监测和服务数据》成为首个获得数据资产登记凭证的上市公司。




8.数据定价重大突破!全国首个数据产品交易价格计算器正式上线



在国家发改委价格监测中心的指导下,贵阳大数据交易所上线全国首个数据产品交易价格计算器。


贵阳大数据交易所基于《数据产品成本评估指引1.0》等规范,从价格形成原理出发,结合数据要素特性,自主研发全国首个数据产品交易价格计算器,通过建立估价模型,以数据产品开发成本为基础,综合考量数据成本、数据质量、隐私含量等多重价值修正因子对于数据产品价格的影响,并基于预计的商业模式和市场规模,评估计算数据产品价格,为数据交易买卖双方议价提供参考,补全“报价-估价-议价”价格形成路径中的关键环节,促进数据要素高效配置、公平交易和自由流动。







新产品/新技术




9.StreamPark 2.0.0 重磅发布,首个 Apache 版本终于来了!



Apache StreamPark(Incubating) 社区正式发布StreamPark 2.0.0,这是StreamPark加入 Apache 孵化器以来发布的第一个版本,也是一个重大功能更新的版本。有超过100位Contributor贡献了超过700个Pull Request,带来了诸多的新特性和改进修复。


StreamPark原名StreamX,是一个简单易用的流处理应用开发框架和操作管理平台。于2019 年由个人组织Streamxhub创建,并于2021年4月在GitHub上开源,2022年8月改名为 StreamPark。


本次发布重写了整个前端模块,UI显示更加美观和专业。前端构建和启动速度同历史版本比提升了 5~10 倍。对 Apache Flink 做了更好的支持,支持最新的 Flink 1.16。部署 Flink 作业 on Kubernetes 达到生产可用级别,另外在实用性和易用性上做了大量改进,修复了诸多历史 Bug 和安全漏洞,建议所有人升级使用。




10.数据湖仓供应商Databricks为其湖屋Lakehouse平台增加新的开发工具



Databricks在其Lakehouse平台中添加了一个新工具,使开发人员能够在熟悉的集成开发环境中编写和测试代码,然后再将其连接到Databricks集群。


Databricks是一家数据湖仓供应商,其平台将数据仓库的结构化数据存储功能与数据湖的非结构化数据功能相结合。


以前,尽管供应商支持开发人员以多种方式处理数据,但这项工作必须在Databricks环境中完成。


现在,随着 Visual Code Extension for Databricks 的发布,湖屋供应商使开发人员能够在将 Visual Studio Code(VS Code)迁移到Databricks之前构建数据、增强智能和机器学习模型和应用程序。


VS Code是微软于2015年推出的集成开发环境(IDE),开发人员通常将其用于大量操作,包括编辑、测试、调试和控制持续集成/持续交付(CI/CD)管道。




11.数据治理和安全服务商Privacera与Dremio LakeHouse集成,帮助企业完成数据治理



基于开源的数据治理和安全SaaS提供商Privacera表示,正在与Dremio的开放式湖屋集成,以帮助企业客户进行数据治理和数据安全。


数据湖仓LakeHouse是一种同时提供存储和分析功能的数据架构,与以本机格式存储数据的数据湖和存储结构化数据(通常为SQL格式)的数据仓库形成鲜明对比。


Privacera和Dremio之间的原生集成,旨在帮助企业客户管理和组织安全的数据访问,同时基于湖屋数据和见解构建现代应用程序。该软件旨在允许Dremio和Privacera的联合企业客户减少管理协作数据的手动任务。


为了减少手动工作,Privacera 提供了一个连接器,旨在为共同客户提供执行细粒度、基于属性的访问控制、标记和数据分类发现、行级筛选、屏蔽、数据加密和集中审核的能力。联合企业客户还可以一次性定义和执行数据访问策略和数据分类,并将其部署到任何地方,包括其他混合和多云数据源。


Privacera已经与AWS、Microsoft Azure、Databricks、Google Cloud、Snowflake和Starburst集成。




12.星环科技、财联社携手发布多模事件驱动量化平台



2月16日下午,星环科技、财联社携手发布“多模态事件驱动量化平台”,,一方面利用财联社作为金融信息服务机构在新闻驱动策略和事件驱动策略上对业务理解的先天优势;另一方面结合了星环科技在数据技术领域的先进能力,为解决这道市场难题开启了一扇门。


作为兼具高效精准的多模态数据存储、特征提取与分析能力和高可信度的数据信息来源的多模态智能量化产品,该平台通过可信数据源的收集、智能标注、知识抽取、自动标签以及标准化结果输出与分析,形成体系化、聚合化的完整知识图谱与有效量化因子,协助和赋能金融机构的交易员、分析师、研究员或相应部门;并可替代原有重复且冗杂的人工数据、资料收集和主体关系梳理流程,辅助金融机构在行业深度、政策导向、宏观经济等方面,进行全面且深入的智能化专家体系搭建,极大提高理解和研究相应场景的效率。


目前,财联社与星环科技已研发了新闻驱动、政策图谱、公告舆情、风控合规、灾害预警方案等8个产品模块,赢得了市场某头部百亿量化私募的认可。目前量化数据已提供给多家私募、证券行业内头部机构进行实测,产品应用场景持续开发中。未来平台将不断通过将业务与技术的不断融合,走在量化市场的最前沿。




13.稳定可靠安全无忧,华为云发布代码托管服务CodeArts Repo



2月20日,华为云代码托管服务CodeArts Repo将于22:00正式上线,这是一款全栈自研、基于Git的云端代码托管服务,旨在保护企业核心代码资产安全,提升企业研发质量和效率。


华为云CodeArts Repo管理并保护着华为1100亿行代码,支撑15万人开发作业,日均1亿次下载量、1PB传输流量、3亿次API调用,一套系统支撑了华为嵌入式、云、终端、车等各类型产品代码管理和协同开发。


源于华为,服务世界,华为云CodeArts Repo着力将华为公司30余年的源代码管理经验外溢,服务千百行业。未来,华为云CodeArts Repo持续创新升级,探索边缘下载加速、多仓协同,提供更丰富的安全检查特性,携手国内外客户、伙伴以及开发者,共同提升软件开发质量和效率。




14.PingCAP Clinic诊断客户端Diag正式开源



PingCAP Clinic诊断服务(简称 PingCAP Clinic)是 PingCAP为TiDB集群提供的诊断服务,支持对使用TiU或 TiDB Operator 部署的集群进行远程定位集群问题和本地快速检查集群状态,用于从全生命周期确保 TiDB 集群稳定运行、预测可出现的集群问题、降低问题出现概率、快速定位并修复问题。


越来越多的用户在TiDB集群部署后也同时部署了的Clinic Diag工具,在需要优化集群性能时,通过Diag将集群的诊断数据采集并上传到Clinic Server端,然后在Server端直接查看诊断数据并生成智能报告,获取集群性能提升的建议。


此次开源的诊断客户端Diag 是部署在集群侧的工具,用于采集集群的诊断数据 (collect)、上传诊断数据到 Clinic Server、对集群进行本地快速健康检查 (check)。通过开源,让用户自由访问和使用Diag的源代码,以更透明的方式了解Diag对于诊断数据采集的逻辑。对于特殊的TiDB 部署场景,用户可以对 Diag 进行修改和定制,以适应其特定的需求,从而让更多的TiDB 集群从 Clinic 中受益。




15.高性能、实时的分析型数据库Apache Doris 1.2.2 Release 版本正式发布



Apache Doris 1.2.2 Release 版式发布!在新版本中,Apache Doris 修复了超过200个问题或性能改进项。同时,1.2.2 版本作为 1.2 LTS 的迭代版本,具备更高的稳定性。


Apache Doris是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。


数据湖分析新增支持自动同步 Hive Metastore 元数据信息;支持读取 Iceberg Snapshot 以及查询 Snapshot 历史;JDBC Catalog 新增支持 PostgreSQL、Clickhouse、Oracle、SQLServer;JDBC Catalog 支持 insert into 操作。




16.微软2月修补了三个零日安全漏洞和77个补丁,SQL Server漏洞修复程序最多



微软在其最新的2月份补丁更新中包括三个零日漏洞和77个修复程序,相当于1 月和去年 12月修复的数量的总和。


在最新一批更新中,总共发布了77个漏洞的补丁,其中9个被归类为“关键”漏洞,因为它们可能允许远程执行代码。


被安全专家描述为“异常重要”的一轮更新,大量更新包括对影响Microsoft Windows、.NET Framework、Microsoft Office、SQL Server、Exchange Server、HoloLens和几种Azure服务的错误修复。


其中在最新一轮更新中,总共解决了六个影响Microsoft SQL服务器的CVE。安全专家指出,这标志着几年来SQL服务器修复次数最多的一次。


其中之一 CVE-2023-21718 被评为严重。微软表示,攻击者可以通过“诱骗未经身份验证的用户尝试通过ODBC连接到恶意SQL服务器数据”来利用此漏洞。


“这可能导致数据库返回恶意数据,这可能会导致客户端上的任意代码执行,”该公告警告说。







爆点事件




17.微软宣布上调Bing Search API定价,费用最高增长1000%



微软近日宣布上调 Bing Search API 定价,最高增幅 1000%。组织和开发人员通过调用 Bing Search API,从而在其产品中使用 Bing 搜索,显示相关搜索结果。


Bing Search API 新版定价将于 2023 年 5 月 1 日生效,之后使用 API 的客户将会按照新的价格收取费用。微软表示:“新的定价模式更准确地反映了 Bing 为改进搜索而继续进行的技术投资”。




18.荷兰黑客通过搜索引擎找到的配置错误的云数据库中窃取窃取了几乎整个奥地利人口的数据



一名荷兰黑客通过配置错误的云数据库窃取了属于910万奥地利公民的数据后被捕。该攻击最初于2020年5月被发现,涉及收费信息服务(GIS),负责在该国收取电视和广播许可费的组织。


该公司的一名员工在测试期间使用了GIS数据,并在没有保护数据库的情况下将其留在网上。调查人员说,黑客通过搜索引擎(“不是谷歌”)找到了这些数据。


这些数据被认为将影响几乎所有奥地利公民,包括姓名、出生日期和注册地址。有人试图使用“DataBox”的名义在臭名昭著的在线黑客避风港RaidForums上出售数据。然后,调查人员秘密购买了这些数据。


在黑客用来存储下载数据的德国服务器被查获和分析后,罪犯的身份得到了确认。调查人员还发现,用于数据的钱是用一种加密货币交换的,警方称这种加密货币很容易识别。







IPO/投融资




19.「国民认证」 完成新一轮数千万元融资,推动强身份认证体系再升级



联想创投子公司国民认证科技(北京)有限公司完成新一轮数千万元融资。本轮由重庆科技成果转化基金投资,将用于公司核心技术创新及市场体系搭建,进一步提升国民认证在身份认证安全领域的核心竞争力。


强身份认证技术开发应用服务商「国民认证」完成数千万人民币B轮融资,投资方为领航新界。


国民认证是一家强身份认证技术开发应用服务商,专注于强身份认证技术开发与应用,采用多因素身份验证 (MFA) 等强大的身份验证技术来确认用户的身份,提高安全性的同时也为用户带来了更多便利性。公司面向主流互联网服务商、政府、企业、金融机构、硬件制造商、操作系统厂商提供多种结合生物识别技术的端到端的完整身份认证解决方案,将持续致力于构建和确保真实的人与虚拟世界的可信连接,为行业用户打造安全便捷的网络服务基础,推进中国互联网在线身份认证基础设施的升级。




20.数据转换供应商DBT Labs收购Transform以增强语义层工具



数据转换供应商DBT Labs收购了Transform Data Inc.,增强其语义建模工具的功能。Transform将使语义层能够支持连接,数据库表之间的连接以创建关系。


DBT Labs(代表数据构建工具)成立于2016年,是一个开源工具,旨在帮助工程师转换数据。它的部署选项仍然包括一个免费的开源版本,但这家总部位于费城的供应商现在还提供团队版本,每个开发人员席位每月 100 美元,以及具有定制定价的企业版本。


Transform成立于2019年,总部位于旧金山,是一家利基分析供应商,其工具使用户能够开发一个业务指标库,他们可以在其中以标准化的方式定义和使用这些指标。


此次收购是DBT Labs的首次收购。财务条款没有披露。




21.工业大数据解决方案提供商「积梦智能」完成数千万人民币A轮融资



工业大数据解决方案提供商「积梦智能」完成数千万人民币A轮融资,投资方为澄潭网络、大观资本。


“积梦智能”是一家工业智能科技公司,致力于生产过程中的大数据管理和应用。通过监控制造生产中的设备状态、环境因素、人员情况、产品质量、工艺过程等,深度挖掘和系统分析这些数据,从而优化作业流程、提高设备能效、增加人均产能、提升产品质量。


积梦智能成立于2017年,是国内领先的工业互联网平台公司,致力于帮助制造业实现数据驱动。用先进的工业互联网平台,工业物联网,标识解析等技术,向供应链产业链赋能,实现全链条的智能决策,服务中国制造业企业的高质量发展。目前,积梦智能已为上汽集团、中国航天、上海电气等制造龙头企业提供平台产品服务。同时,SaaS化的云服务产品已经赋能上百家中小制造企业。




扫码关注


大数据应用,从现在开始


END


文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论