
新闻速递

本周热点
1.TDH9.3新一代湖仓集存储,多模型统一架构,驱动高效数据价值
2.Databricks Delta Lake 3.0推出,对抗Apache Iceberg
3.从Databricks和Snowflake之争,再谈湖仓一体化架构
大数据
4.Cloudera宣布Cloudera Observability面向公有云或私有云环境中使用CDP客户开放
5.九章云极DataCanvas公司重磅发布AIFS+DataPilot
6.ClickHouse Cloud 现已在 GCP 上推出,简化了启动和管理
7.上海浦东软件园战略入股,开源中国获7.75亿元B+轮融资,成为完全中立平台
8.农业信息化解决方案提供商「新纪元大数据」完成数百万人民币天使轮融资,投资方为满舵投资。
数据库
9.《数据库发展研究报告(2023年)》正式发布
10.星环分布式交易数据库KunDB通过中国信通院首批“软件自研创新能力”专项评估
11.华为云分布式NoSQL数据库服务GaussDB(for Cassandra)推出了兼容DynamoDB特性
12.GBASE南大通用携手华为存储发布金融核心级数据库高可用解决方案
13.Oracle Database 19c支持ARM架构
14.时序数据库Timeplus全新的协作功能现已上线
15.全球首个金融图数据库测试基准 FinBench 正式发布
数据安全
16.数说安全研究院发布“2023中国网络安全产业八大趋势”
17.新一代网络空间安全公司「赛博昆仑」完成近亿人民币A轮融资,投资方为达晨财智,红杉中国。
18.受到7000万美元赎金要求的打击,台积电将LockBit锁定为被破坏的供应商
19.VMware 与业界巨头合作,实现开源机密计算突破
AI
20.低代码开发平台Mendix 10发布,推出聊天机器人和嵌入式人工智能模型
21.Salesforce推出针对8K输入序列长度训练的新 LLM
22.Snowflake和NVIDIA 合作,企业能够利用其数据在Snowflake数据云中进行生成式AI
23.比尔盖茨领投!类ChatGPT平台Inflection AI获13亿美元融资
本周热点

*
11.TDH9.3新一代湖仓集存储,多模型统一架构,驱动高效数据价值
星环科技正式发布大数据基础平台TDH9.3版本,推出了新一代湖仓集存储格式Holodesk,一份数据满足数据湖的离线实时接入、数仓的复杂加工以及数据集市的分析需求,避免数据冗余,减少数据流转,提升业务综合性能与时效性。同时,分布式计算引擎实现了向量化升级,综合性能大幅度提升。
此外,TDH 9.3对多模型统一技术架构进行了迭代升级,全新发布分布式向量数据库Transwarp Hippo,共支持11种模型数据统一存储管理,用统一查询处理语言完成跨模型数据流转与关联分析,让业务开发更加便捷。

*
2.Databricks Delta Lake 3.0推出,对抗Apache Iceberg
Databricks推出了其数据湖屋产品的新版本,称为Delta Lake 3.0,以应对竞争对手Snowflake使用的Apache Iceberg表的日益普及。
该公司表示,作为Delta Lake 3.0的一部分,该公司推出了一种新的通用表格格式,称为UniForm,将允许企业将数据湖仓与其他表格格式(如Apache Iceberg和Apache Hudi)一起使用。
数据湖仓是一种同时提供存储和分析功能的数据架构,与以本机格式存储数据的数据湖和数据仓库(通常为 SQL 格式)的概念相反。
Databricks说,UniForm消除了在进行分析或构建AI模型时手动转换来自不同数据湖和数据仓库的文件的需要。
据分析师称,新的表格格式是Databricks将其数据湖仓与世界其他地区连接起来并挑战竞争对手Snowflake的战略,特别是在Apache Iceberg在过去几年中获得更多供应商支持的背景下。

*
3.从Databricks和Snowflake之争,再谈湖仓一体化架构
Snowflake 是新生代的云上数仓的主导者之一,算是云数仓的主要推动者,目前已经实现了基于多公有云架构的云上数仓服务。
Databricks是属于Spark 的商业化公司,一直致力于提供基于 Spark 的云服务,打造了Delta Lake,已将其能力大幅扩展至传统数据仓库的方向。Databricks正在打造Data Lakehouse,一种新颖的数据湖仓概念。
Databricks 最初主要是一家数据湖公司,但一直在添加数仓功能。Snowflake 则是反过来的,作为一家数仓起家的公司,却一直忙于拥抱数据湖功能。
这说明什么?说明湖仓一体化已经成为不可逆的重要趋势,正如Databricks所说的那样:“从长远来看,所有数据仓库都将被纳入数据湖仓”。
大数据

1*
4.Cloudera宣布Cloudera Observability面向公有云或私有云环境中使用CDP客户开放
混合数据公司Cloudera宣布,Cloudera Observability现已面向所有在公有云或私有云环境中使用Cloudera Data Platform(CDP)的客户开放。该解决方案为借助CDP实现的开放式湖仓一体带来了全新功能,通过提供数据、应用程序和基础设施组件方面的可执行洞察,来优化成本、自动解决问题并提高性能。客户可通过财务治理和云成本优化(FinOps)管理CDP的成本,从而避免预算超支,并能够为了规划进行容量预测。
Cloudera大中华区副总裁王刚表示:中国企业很重视云采用和云迁移的规划,但较少为云成本制定优化计划,同时也面临着跨本地和多云管理的复杂性等问题。Cloudera Observability使客户能够监控、了解和优化其CDP部署,为企业的云采用和控制带来全面可见性。未来我们将不断进行技术创新,为中国企业提供更高性能、更优成本效益的云端体验。
Cloudera Observability依托Cloudera在混合数据解决方案领域的经验,使客户能够监控、了解和优化其CDP部署。客户还可以通过可自定义的自动操作和预先构建的操作,发出警报、主动避免问题并优化工作负载。

*
5.九章云极DataCanvas公司发布AIFS+DataPilot
九章云极DataCanvas发布AIFS人工智能基础软件和DataPilot数据领航员两大变革性AI 产品系列。
AIFS(AI Foundation Software)是九章云极DataCanvas在大模型主导的New AI时代对于全面构建AI能力的回答,也是DataCanvas产品家族的最新升级。AIFS作为一款行业领先的人工智能应用构建基础设施平台,覆盖了大模型的训练、精调、压缩、部署、推理和监控以及小模型的全生命周期过程,它为数据科学家、应用程序开发人员和业务专家提供了一套工具,使不同角色的人员可以相互协作,轻松地处理数据并使用这些数据来开发、训练和部署任何规模的模型。
DataPilot数据领航员,一种数据处理新范式,是九章云极DataCanvas自研基于大模型的新一代数据架构工具产品。充分利用DataCanvas Alaya九章元识大模型的通用文本的理解和生成能力以及在数据领域的微调优化,DataPilot可以帮助用户实现数据在建模全生命周期的智能化与自动化。
而“向量海”(Vector Ocean),则是九章云极DataCanvas公司基于多年来在数据库领域的研究和实践,结合向量数据的发展方向,创造性提出的数据发展的终极形态。

*
6.ClickHouse Cloud 现已在 GCP 上推出,简化了启动和管理
专为实时分析而设计的开源列式数据库的创建者ClickHouse Inc.推出的ClickHouse Cloud现在可以在Google Cloud Platform(GCP)上应用,扩大了ClickHouse对客户选择的云平台的适应范围。
ClickHouse Cloud是开源ClickHouse的无服务器产品,是一个针对实时分析进行微调的数据库,可有效地利用资源为任何工作负载提供安全和可扩展的性能。
据该公司称,ClickHouse Cloud旨在承受PB级数据集,减轻了对手动分片或手动数据移动的需求,同时提供了令人印象深刻的查询性能。该平台将计算分离,同时利用通用对象存储作为其主存储,从而显著提高了性价比。
ClickHouse 受到内置安全最佳实践的保护,这些最佳实践针对 ClickHouse Cloud 强化、测试和验证 ClickHouse 构建,并通过跨多个可用区的自动复制进行保护,以防止有害中断。
在GCP上推出ClickHouse Cloud极大地简化了启动和管理,用户只需单击几下即可启动新服务,只需几分钟即可获得可操作的见解。据该公司称,GCP上的ClickHouse Cloud发布还使用户能够将ClickHouse的功能与Google BigQuery相结合,大大加快查询速度,以提高面向客户的应用程序和内部分析的性能。

*
7.上海浦东软件园战略入股,开源中国获7.75亿元B+轮融资,成为完全中立平台
开源技术社区「开源中国」完成7.75亿人民币B+轮融资,由FutureX天际资本领投,浦东科创集团、泰达科投、浦软孵化器、张江科投、君联资本、国际创投、瑞力投资、容亿投资、中国移动 、中国互联网投资基金、盛澄私募基金、联想创投、上海科创投集团跟投。
开源中国创立于2008年,收录全球知名开源项目近10万款,涉及几百个不同分类,旗下代码托管平台Gitee为目前国内规模领先的代码托管服务平台,国内知名开源项目OpenHarmony、OceanBase等均托管于此,基于该平台于2020年牵头建设工信部国家开源托管平台项目。Gitee平台于2017年上线发布针对企业级的研发效能平台Gitee企业版,目前已服务1000万开发者用户、26万家企业(含1200家中大型私有化部署企业)以及2000多家高等院校。

*
8.农业信息化解决方案提供商「新纪元大数据」完成数百万人民币天使轮融资
深圳市新纪元数据产业有限公司近期完成估值1.2亿元的天使轮融资,本轮融资由上海满舵投资管理有限公司完成,投资金额数百万元人民币,本轮融资资金主要用于数据采集、企业运营等方面。
新纪元数据产业致力于用互联网建立农业标准化体系,挖掘百万亿农业市场。依靠互联网+农业的新商业模式, 构建农业 F2B 供应链数据整合平台,打造农资商城,通过平台完成产品的产前、产中、产后的信息传递和信息的记录分析,把生产厂商、农资卖店、农户通过服务平台整合在一起进行对接,共建农资生态圈实现多方共赢!
数据库

*
9.《数据库发展研究报告(2023年)》正式发布
7月4日,《数据库发展研究报告(2023年)》正式发布。报告核心观点:市场规模:全球近833亿美元,我国公有云数据库市场规模首次过半;发展周期,全球数据库发展经历两轮热周期;从地域看,全球数据库产业聚集效应明显,北京为我国数据库产业贡献主要力量;从类型看,非关系型数据库在全球范围占比略大;从模式看,开源模式在全球范围内发展势头迅猛;创新方面,我国创新实力不断增强;从标准看,我国数据库产业标准引领作用初见成效;技术方面,围绕三大方面向12个技术方向不断演进;应用方面,由边缘系统至核心系统、由重点行业向全行业应用铺开


*
10.星环分布式交易数据库KunDB通过中国信通院首批“软件自研创新能力”专项评估
近日,中国信通院首批“软件自研创新能力”(可信研创)专项评估结果发布,星环科技分布式交易型数据库KunDB是唯一一款通过该专项评估的国产数据库产品,表明了其在“自研率高、安全性强、合规度高、稳定性好”等方面具有国内领先的自研水平和可信度。
中国信通院针对软件产品自研水平评价的痛点,重磅推出“软件自研创新能力”专项评估(简称“可信研创”)。“软件自研创新能力”专项评估旨在实现“自研率高”“安全性强”“合规度高”“稳定性好”四大目标,提升自研创新产品的可信度。
KunDB是星环科技自主研发的分布式交易型数据库,具备高度兼容Oracle和MySQL、高可用、高性能、集中式与分布式一体化等特性,为企业核心业务系统提供完备的国产化数据库能力支撑。基于自研内存数据库引擎,KunDB单机TPC-C达到188万tpmC,同时性能扩展比超90%,可实现Oralce和MySQL的国产化替代,满足企业关键业务处理、高并发查询、分布式改造、交易分析混合的数据中台等复杂场景,在金融、政务、能源、医疗、交通、教育等多个行业应用,为用户提供高性能、稳定可靠、经济实用的国产化数据库产品。

*
11.华为云分布式NoSQL数据库服务GaussDB(for Cassandra)推出了兼容DynamoDB特性
为了进一步满足DynamoDB用户的一些潜在需求,为客户提供更多的选择,华为云分布式NoSQL数据库服务GaussDB(for Cassandra)推出了兼容DynamoDB特性,帮助用户更加丝滑地从DynamoDB迁移到GaussDB(for Cassandra)。
在兼容DynamoDB协议方面,GaussDB(for Cassandra)严格遵循了DynamoDB的语法和数据模型。因此DynamoDB的应用程序可以轻松地迁移至GaussDB(for Cassandra);此外,GaussDB(for Cassandra)还提供了多种自动化管理和运维功能,例如自动备份、故障检测和容错等,有助于用户更加方便地管理和运维数据库。

1*
12.GBASE南大通用携手华为存储发布金融核心级数据库高可用解决方案
GBASE南大通用联手华为存储共同发布“金融核心级数据库高可用解决方案”,基于存算分离+共享存储架构,通过华为OceanStor闪存存储和南大通用基于共享存储的数据库集群GBase 8s,提供满足金融核心系统要求的高性能、高可用数据库解决方案,加速金融、运营商等关键行业基础设施科技转型。
该方案基于存算分离+共享存储架构,充分融合GBase南大通用先进的数据库集群技术和华为OceanStor全闪存存储全球领先的高可用、高性能技术,打造出满足金融核心级系统要求的数据库高可用解决方案。

1*
13.Oracle Database 19c支持ARM架构
Oracle宣称Oracle Database 19c是目前我们为您提供的长生命周期版本的数据库。它可以运行在许多操作系统上,比如Linux、Windows等。这个数据库版本也可以使用多种硬件平台,比如Intel或者AMD。在太平洋时间2023年6月28日,我们又为您提供了一种新的平台支持,那就是ARM。无论在云端还是您的本地数据中心,您都可以将Oracle Database 19c部署在当今流行的ARM架构上。
ARM技术有着非常多的优势,比如我们所熟知的节能和环保,尤其是被广泛应用于各家大规模云计算中心的Ampere处理器。据不完全统计,目前已经有1800亿个Ampere处理器被应用在智能手机、物联网传感器或者我们所熟知的其他智能设备上。通过这款高性能、节能环保的处理器,您可以运行越来越多的复杂应用程序和工作负载。

1*
14.时序数据库Timeplus全新的协作功能现已上线
时序数据库Timeplus上线新协作功能。在最近的几个月,用户可以无限制地邀请团队成员到自己的Timeplus工作空间。同一工作区中的成员可以访问和编辑所有流、数据源、数据下游、仪表板等。但是,只有工作区所有者可以邀请或删除成员。
Timeplus Cloud的其他新功能包括:
·可以通过Kafka Connect插件将数据推送到Timeplus中
·用于Apache Kafka和Redpanda模块的Protobuf编码
·流数据和历史数据的保留策略
·最新版本: REST API v1beta2
·文档的新URL。

*
15.全球首个金融图数据库测试基准 FinBench 正式发布
国际关联数据基准委员会(LDBC)宣布全球首个金融图数据库测试基准的首个版本(v0.1.0)正式发布,命名为 FinBench。该测试基准由蚂蚁集团发起,并在LDBC指导下由多家机构联合完成,旨在评估金融场景下图数据库的功能和性能,为金融行业提供量化的基准测试工具。
和聚焦社交网络场景的 LDBC-SNB 测试基准不同,FinBench 模拟了金融场景下真实的数据分布和数据查询,帮助了解被测系统在金融场景下的综合表现,为金融行业用户选择和采购图计算产品提供了专业、客观的标准和工具。
作为该项目的主导发起者,蚂蚁集团联合全球多家科技公司,通过共同努力成功地开发了这一全新基准测试软件,并于今年6月通过项目委员会投票。
数据安全

*
16.数说安全研究院发布“2023中国网络安全产业八大趋势”
中国网络安全产业处于较快的发展阶段,数说安全为大家总结出了2023年中国网络安全产业八大趋势,该八大趋势代表了我国网络安全产业的最新动向与趋势方向,将持续促进产业发展。
趋势一:数字经济。数字经济发展成为网络安全发展的新引擎、新动力。
趋势二:人工智能。人工智能技术对网络安全行业带来了新的机遇与挑战。
趋势三:顶层设计。政策的顶层设计逐渐完善,筑牢行业发展的政策基础。
趋势四:数据安全。数据成为重要生产要素,数据安全领域将保持快速增长。
趋势五:信创。信创加速行业渗透,带动网络安全进一步增长。
趋势六:服务化转型。中国网络信息安全市场持续向服务化转型。
趋势七:关基保护。关键信息基础设施行业网络保护体系的完善进一步扩展网络安全市场空间。
趋势八:密码。商用密码应用领域不断扩大。

*
17.新一代网络空间安全公司「赛博昆仑」完成近亿人民币A轮融资
赛博昆仑是专注于软件与系统安全的新一代网络空间安全公司。以国际顶级漏洞能力的昆仑实验室为核心驱动力,基于独有的安全技术和情报能力,专注提供基于漏洞检测与修复完整生命周期的企业级产品与解决方案。为此,赛博昆仑构建了覆盖多个领域与产业需求的新一代网络安全产品与服务平台。致力于为政府、金融、能源、运营商、教育、医疗、互联网等行业客户提供全球最尖端的、面向未来的高级网络安全产品、解决方案与服务。
这次融资将加速赛博昆仑在网络安全领域的创新和发展,并为客户带来更强大、可靠的安全解决方案,以及更多创新和价值。

*
18.受到7000万美元赎金要求的打击,台积电将LockBit锁定为被破坏的供应商
半导体制造商台积电(TSMC)指责其一家设备供应商LockBit漏洞,使得芯片制造巨头面临7000万美元的赎金要求。
该公司已将系统集成商Kinmax Technology列为被破坏的第三方供应商,但没有透露被泄露数据的性质。
台积电表示:“台积电最近意识到,我们的一家IT硬件供应商经历了网络安全事件,导致与服务器初始设置和配置相关的信息泄露。”
7月初,LockBit勒索软件团伙的分支机构在其网站上分享了被盗台积电文件的目录列表截图,要求台积电在8月6日的最后期限内支付7000万美元。
该帖子称,付款失败将导致黑客组织泄露的信息,包括台积电IT网络的登录凭据。

*
19.VMware 与业界巨头合作,实现开源机密计算突破
虚拟化技术提供商VMware为机密计算领域带来了令人振奋的消息。该公司已宣布与AMD、三星和RISC-V基石社区的成员建立战略合作伙伴关系。他们共同致力于通过开源认证者框架项目彻底改变机密计算应用程序的开发和运营。
机密计算是一门新兴学科,专注于在积极使用数据时保护数据,超越了传统的加密方法。通过利用基于硬件的可信执行环境 (TEE),机密计算可确保处理过程中数据的安全性,从而有效地保护应用程序和敏感信息免遭未经授权的访问或篡改。
VMware首席技术官Kit Colbert表示,认证者框架贡献者的共同努力将大大简化机密计算的采用和实施,使ISV、企业客户和主权云提供商能够更高效、更安全地利用该技术。
认证者框架包括两个重要组件:具有强大 API 的应用程序开发库和可扩展的认证服务。API 提供了一套编程接口,可简化移植现有应用程序或创建新应用程序的过程。同时,认证服务评估策略并有效管理系统之间的信任关系。
AI

*
20.低代码开发平台Mendix 10发布,推出聊天机器人和嵌入式人工智能模型
Mendix发布了其低代码开发平台的新版本,该平台将使公司更容易构建人工智能应用程序。
新版本名为Mendix 10,还添加了两个人工智能聊天机器人,旨在简化开发人员的工作。
Mendix的低代码平台使公司能够以比通常所需更少的工作量构建应用程序。开发人员可以通过拖放界面将预先打包的软件组件组装到应用程序中。必要时,可以使用自定义代码对组件进行扩展。
2018年,Mendix通过7.3亿美元的收购,成为西门子AG的子公司。自那以后,Mendix的客户群已发展到4,000多家企业。
Mendix 10中的第一个主要增强项是一个名为ML Kit的工具包。它允许开发人员将人工智能模型纳入他们使用Mendix 10构建的应用程序中。该工具包支持基于ONNX的模型,ONNX是一种在企业中广泛使用的开源神经网络格式。
根据Mendix的说法,ML套件可以访问数十个预先训练的人工智能模型。公司也可以使用自定义模型。该工具包可与PyTorch、Caffee2和一系列其他兼容ONNX的人工智能开发框架配合使用。
通常,应用程序和它们所包含的人工智能模型在单独的服务器上运行。数据在服务器之间移动需要一定的时间,这会造成延迟。Mendix表示,ML Kit允许公司在应用程序自己的容器中运行为应用程序供电的神经网络,从而减少了延迟。
该工具包承诺提供的另一个好处是更快的软件集成。当应用程序及其人工智能模型在单独的基础设施上运行时,集成它们可能需要大量的自定义代码。Mendix表示,其平台可以在数小时内完成任务,而不是通常需要的数周。

*
21.Salesforce推出针对8K输入序列长度训练的新 LLM
总部位于美国的软件即服务(SaaS)巨头Salesforce最近推出了XGen-7B,这是一系列在7K输入序列长度上训练的8B大型语言模型(LLM)。这些模型在Apache 2.0许可证下发布。
在标准的NLP基准测试中,与其他开源LLM如Falcon,LLaMA,Redpajama和OpenLLaMA等相比,XGen取得了相当或更好的结果。
到目前为止,上面列出的模型已经使用最大 2K 令牌序列长度进行了训练,这是对长序列建模的一个关键限制。
有鉴于此,我们训练了一系列名为XGen的7B LLM,对高达8K的序列长度进行了标准的密集关注,最多可用于1.5T代币。我们还在公共领域的教学数据上微调XGen模型,创建它们的指令调整对应物(XGen-7B-inst)。

*
22.Snowflake和NVIDIA 合作,企业能够利用其数据在Snowflake数据云中进行生成式AI
数据云公司Snowflake和 NVIDIA 合作,为企业提供一条加速路径,使用他们自己的专有数据创建定制的生成 AI 应用程序,所有这些都安全地在 Snowflake Data Cloud 中。
据两家公司称,借助用于开发大型语言模型(LLM)的NVIDIA NeMo平台和NVIDIA GPU加速计算,Snowflake将使企业能够使用其Snowflake账户中的数据来为高级生成AI服务制作自定义LLM,包括聊天机器人、搜索和摘要。
在不移动数据的情况下自定义LLM的能力使专有信息能够在Snowflake平台中保持完全安全和治理。
通过集成 Snowflake 和 NVIDIA 的 AI 技术,客户可以快速轻松地构建、部署和管理定制应用程序,从而将生成式 AI 的强大功能带到各种用例中其业务的所有部分。
此外,在数据云中扩展 AI 功能使这些客户能够在其受治理数据已驻留的位置创建生成式 AI 应用程序,这一优势可显著降低成本和延迟,同时保持其数据的安全性。

*
23.比尔盖茨领投!类ChatGPT平台Inflection AI获13亿美元融资
生成式AI平台Inflection AI在官网宣布,获得13亿美元(约94亿元)融资。本次由微软创始人比尔盖茨、谷歌前CEO埃里克施密特、英伟达、微软、LinkedIn联合创始人里德·霍夫曼领投。(免费无需注册体验地址:https://pi.ai/talk)
Inflection AI提供了一个类ChatGPT对话聊天机器人Pi,支持中文、英文、代码生成、语音提问等功能,例如,帮我生成一段用于鞋子营销的文案,要求轻松有网络梗,字数在200左右,结构明确首尾呼应。Inflection AI可快速自动生成内容。
截至目前,Inflection AI本次的融资金额成为全球生成式AI赛道最大融资之一,超过ChatGPT母公司OpenAI在2019年7月22日获得的10亿美元。

春华秋实!

扫码关注
大数据应用
从现在开始

End




