大数据分析大模型求索;1对7数据平台国产化替代;Snowflake、Databricks收购大模型;奇安信成立数据安全公司···

Hadoop大数据应用 2023-06-01

154

新闻速记

本周热点

1.让大数据智能化、多模态、平民化，大数据技术与产品矩阵集体出列
2.国家网信办发布《2022数字中国发展报告(全文)》
3.阿里达摩院：GPT-4 vs 年薪60万的数据分析师，成本只占0.45%

大数据

4.知乎发布最新大模型应用“搜索聚合”，即日开启内测
5.Snowflake收购Neeva，为Data Cloud添加基于AI的生成搜索
6.ArangoDB 3.11 提升了搜索和图形查询性能优化
7.94家产学研机构共同编撰的《数据安全治理白皮书5.0》发布
8.IDC数据云报告发布，数据云行业应用发展地图V1.0
9.Amazon RDS for PostgreSQL现在支持 pgvector，简化机器学习模型集成
10.AWS发布全新Amazon Aurora I/O-Optimized服务，降低用户数据库成本
11.北极九章与镜舟数据库发布联合解决方案，打造简单极速的数据分析体验
12.长亮科技携手GBASE南大通用重磅推出金融数据仓库联合解决方案
13.Databricks38亿美元收购以AI为中心的Okera，以帮助LLM的数据治理
14.Qlik收购Talend，将数据集成与数据转换、质量和治理功能相结合

数据库

15.四家伙伴发布基于openGauss的数据库一体机
16.PostgreSQL 16 Beta 1 版本发布!
17.CockroachDB现在支持Microsoft Azure和多区域部署
18.Yugabyte为YugabyteDB 2.18 添加了多区域 Kubernetes支持

数据安全

19.IBM 推出端到端量子安全技术，保护政府和企业最有价值的数据
20.RKVST发布区块链支持的解决方案以验证数据的真实性
21.奇安信成立数据安全分公司新品“奇安天盾”数博会首发
22.新兴数据安全数据保护商「领信数科」完成超亿人民币B轮融资
23.联合国发布隐私增强技术指南，涵盖18个全球典型案例!
24.零信任接入和移动安全解决方案提供商「辰尧科技」完成超千万融资

25.Salesforce推出Tableau Pulse，将生成式AI引入用户体验
26.SAP和微软合作提供生成式AI产品，以解决人才缺口问题
27.NVIDIA 与微软合作，为企业的生成式 AI 提供增强功能
28.Meta开源大模型：支持4000+语言识别，1100+种语音文本转换
29.英特尔发布Aurora genAI大模型，力争赶超ChatGPT

本周热点

6·1

1.让大数据智能化、多模态、平民化，大数据技术与产品矩阵集体出列

星环科技创始人、CEO孙元浩表示，未来人人都是数据科学家，人类与数据的交互方式将发生重大变革，语言、视频等自然语言的交互方式将逐渐普及,每个人都将需要一个“虚拟业务助手”。

孙元浩表示，未来数据处理将走向智能化、多模态和平民化，其中领域大模型让数据处理的自动化程度更高、结果更能为我所用;数据处理将从单一模态向多模态进化，企业数据分析来到新的次元;数据处理平民化，让普通人不再需要掌握复杂工具，就可以快速处理数据。

为了实现数据处理的智能化、多模态、平民化，在“向星力·未来数据技术峰会(FDTC)”上，星环科技推出众多创新产品，包括大模型持续提升和持续开发工具Sophon LLMOps;业界首创的金融大模型无涯、大数据分析大模型SoLar“求索”等多个行业大模型;实现湖、仓、集一体化和多模架构的大数据基础平台TDH 9.3;能够替代国外产品的分布式分析型数据库ArgoDB 6.0、分布式交易型KunDB 3.2;构建海量数据互联智慧“星”图的分布式图数据StellarDB 5.0;面向多元场景的高性能时序数据库TimeLyre 9.1;提出六易、三仓、两中心的新一代智能分析全流程平台Sophon;数据要素流通产品Navier 3.1等产品。

基于未来技术，星环科技的这些全系列产品将助力企业加速数据化、智能化转型，加速基础软件的国产化替代，服务数据经济发展。

6·1

2.国家网信办发布《2022数字中国发展报告(全文)》

国家互联网信息办公室发布《数字中国发展报告(2022年)》。《报告》分6个篇章、14个章节，系统总结了2022年各地区、各部门推进数字中国建设取得的主要成效，开展了数字中国发展地区评价，并展望了2023年数字中国发展工作。

《报告》指出，2022年，我国数字经济规模达50.2万亿元，总量稳居世界第二，同比名义增长10.3%，占国内生产总值比重提升至41.5%。软件业务收入达10.81万亿元，同比增长11.2%。科创板、创业板已上市战略性新兴产业企业中，数字领域相关企业占比分别接近40%和35%。

2023年，重点做好四个方面工作：一是夯实数字中国建设基础，二是全面赋能经济社会发展，三是强化数字中国关键能力;四是优化数字化发展环境。

6·1

3.阿里达摩院：GPT-4 vs 年薪60万的数据分析师，成本只占0.45%

阿里巴巴旗下研究机构达摩院及新加坡南洋理工大学的研究发现，OpenAI新发布的大型语言模型GPT-4进行数据分析的成本只要人类资深分析师(平均年薪9万美元)的0.45%，或是菜鸟分析员的0.71%。

报告显示，GPT-4的成本不但远比人类分析师低廉，效率也快上不少。不过，GPT-4的图表正确度、部分个案的报告呈现及格式表现不如人类。

PT-4当数据分析师，都能干什么。论文重点考察了GPT-4作为数据分析师的以下几种能力：

生成SQL和Python代码，执行代码获得数据和图表，从数据和外部知识源中分析数据，得出结论。

大数据

6·1

4.知乎发布最新大模型应用“搜索聚合”，即日开启内测

知乎联合面壁智能发布了最新的大语言模型成果。知乎模型应用“搜索聚合”即日开启内测，面壁智能研发的中文基座大模型CPM-Bee10b全面开源，并发布了对话类模型产品“面壁露卡”。

今年4月，知乎发布了大语言模型“知海图AI”并内测首个站内大模型应用功能“热榜摘要”。一个月后，知乎带来了又一款站内的大模型应用功能“搜索聚合”。

该产品将大模型能力应用到了知乎搜索上，每当用户触发搜索时，系统就会从大量提问和回答中聚合观点，提高用户获取信息、形成决策的效率。

此外，面壁智能联合 OpenBMB 社区，将自研CPM-Bee 10b 模型开源，并允许商用。该模型从零开始自主训练，基于Transformer架构，中英双语表现优秀，拥有百亿量级参数、万亿级高质量语料。

6·1

5.Snowflake收购Neeva，为Data Cloud添加基于AI的生成搜索

基于云的数据仓库公司Snowflake表示，它正在收购初创公司Neeva，收购金额未公开，以在其数据云平台中添加基于AI的生成搜索。

Neeva是一家搜索公司，旨在使搜索在规模上更加智能。Neeva创造了一种独特而变革性的搜索体验，利用生成人工智能和其他创新，允许用户以新的方式查询和发现数据。

6·1

6.ArangoDB 3.11 提升了搜索和图形查询性能优化

图形数据和分析平台公司ArangoDB 发布 ArangoDB 3.11，支持增强功能，以加速其在搜索、图形和分析用例中的性能。

ArangoDB 3.11包括ArangoSearch的性能改进，ArangoDB的原生集成全文搜索和排名引擎，以及其Web界面的新功能，以简化数据库的操作。

ArangoDB 3.11旨在将高级搜索和分析功能提升到新的高度，同时还引入了大量新的性能，可用性和操作改进。

ArangoDB 3.11 中的新功能包括：更快的搜索和图形查询性能，改进的数据库管理用户体验，数据科学和分析操作增强功能等。

6·1

7.94家产学研机构共同编撰的《数据安全治理白皮书5.0》发布

由中国计算机学会计算机安全专业委员会、中关村网络安全与信息化产业联盟、工业信息安全产业发展联盟等94家产学研机构共同编撰的《数据安全治理白皮书5.0》于第六届中国数据安全治理高峰论坛上正式发布。

《数据安全治理白皮书5.0》在4.0版本的基础上，分析我国数字经济战略发展与数据安全新形势新动态，厘清数据安全治理概念并诠释数据安全治理内涵，完善数据安全治理需求与框架，解读最新法律法规及标准等监管要求与技术规范，全面、系统介绍围绕数据生命周期的相关安全技术需求、安全技术工具与技术发展趋势，归纳2022年以来典型的数据安全事件与相关法律案件并进行分析，提出了数据安全治理的未来展望和建议。

6·1

8.IDC数据云报告发布，数据云行业应用发展地图V1.0

数据云作为新一代数据体系架构，围绕政府Government、城市City、产业Industrial为数字中国发展打造GCI发展底座，实现政企价值传递和反馈闭环。面向数据全生命周期管理，提供数据云一站式服务(安全、采集，存储，管理，开发，流通，创新)，促进千行百业应用赋能，加快数据要素价值挖掘和共享流通，是产业智能化的底座。

未来，面对海量政府和行业数据，随着应用需求的升级融合，提供集数据中台和业务中台于一体的核心能力，并满足可伸缩弹性的用户需求，实现上层模型服务的灵活编排落地，是厂商更好更灵活地服务企业升级的关键。

IDC定义下的数据云是基于云的数据技术体系架构，提供安全、全周期、统一、智能、弹性的数据要素采集、管理、分析、流通、价值提升服务，打造底层统一的技术栈，融合数据中台与业务中台能力，上层实现数据的快速流通和产品一键部署。数据云的主要优势包括提供既有基础工具、专家经验、松耦合化组件、简易开发能力、可预见性、生态支持。

同时，IDC发布数据云行业应用发展地图V1.0——模型走向标准化、产品化。模型即服务Model as a Service成为主要产品落地趋势，厂商依托丰富的行业专家经验，将能力沉淀为各领域底层能力，形成通用数据模型库、场景模型库和算法库，实现数据服务标准化、智能化、产品化，推动更广范围和更深层次的落地，未来供应链、农业、工业质检、应急指挥、能源将拥有更大市场潜力。

6·1

9.Amazon RDS for PostgreSQL 现在支持 pgvector，简化机器学习模型集成

Amazon Relational Database Service(RDS)for PostgreSQL 现在支持 pgvector 扩展，用于在数据库中存储来自机器学习(ML)模型的嵌入并执行有效的相似度搜索。嵌入是由生成式人工智能创建的数字表示法(向量)，用于捕获大型语言模型(LLM)中的文本输入的语义含义。pgvector 可以存储和搜索来自 Amazon Bedrock、Amazon SageMaker 等的嵌入。

通过在 Amazon RDS 上使用 pgvector，您可以简单地为支持机器学习的应用程序设置、操作和扩展数据库。pgvector 扩展允许您在电子商务、媒体、健康应用程序等应用中构建机器学习功能，以便在目录中查找类似的项目。例如，流式传输服务可以使用 pgvector 来提供与您刚刚看过的电影相似的电影推荐列表。

pgvector 扩展可在由光环新网运营的亚马逊云科技中国(北京)区域和由西云数据运营的亚马逊云科技中国(宁夏)区域中运行 PostgreSQL 15.2 及更高版本的所有数据库实例上使用。

6·1

10.AWS发布全新Amazon Aurora I/O-Optimized服务，降低用户数据库成本

AWS推出Aurora I/O-Optimized服务的最新版本，主要面向那些执行大量数据I/O操作的应用。

Aurora I/O 优化可为客户要求最苛刻的工作负载提供更高的性能、更高的吞吐量并减少延迟。借助 Aurora I/O 优化版，读写 I/O 操作无需支付任何费用 — 您只需为数据库实例和存储使用量付费，从而轻松提前预测数据库支出。Aurora I/O 优化可为 I/O 密集型应用程序节省高达 40% 的成本，其中 I/O 费用超过Aurora 数据库总支出的 25%。

您现在可以在两种配置之间进行选择：Aurora 标准或 Aurora I/O 优化。对于具有中低 I/O 的应用，Aurora 标准是一个经济高效的选择。对于具有高 I/O 的应用，Aurora I/O 优化可提供更高的性价比、可预测的定价和高达 40% 的成本节约。您只需在 AWS 管理控制台中单击一下即可切换集群，也可以通过 AWS 命令行界面使用命令切换集群。Aurora I/O 优化配置在 Aurora 无服务器 v2 和预置实例上受支持，包括按需和预留，包括现有的 Aurora 预留实例。您可以每 30 天将现有数据库集群切换到 Aurora I/O 优化一次，并随时切换回 Aurora 标准。

Aurora是一种托管的关系型数据库，企业可以使用它而无需维护底层基础设施。Aurora与另外两个主流的关系型数据库MySQL和PostgreSQL相互兼容，也就是说，企业可以把为MySQL和PostgreSQL编写的应用切换到 Aurora，而无需进行重大的代码更改。

6·1

11.北极九章与镜舟数据库发布联合解决方案，打造简单极速的数据分析体验

北极九章携手新一代技术统一 MPP 数据库镜舟数据库，发布联合解决方案。基于双方领先的搜索式增强分析能力和数据库极速性能，为企业内的非技术用户提供更简单、更快速的数据洞察，让数据真正成为生产力。

北极九章与镜舟数据库强强联合，攻克实时分析链路上两大挑战：数据需求处理流程长、数据分析耗时久。

北极九章 DataGPT 凭借领先的自然语言处理、机器学习和 AI 技术，实现从自然语言到数据洞察一步直达，使用户无需学习代码或复杂的分析工具，即可轻松准确地查询并分析企业级数据。借助北极九章，业务人员的数据分析需求响应时间从平均 2-5 周缩减至数秒，最大程度地保留数据的即时价值。

镜舟数据库作为新一代极速统一 MPP 数据库，通过实现全面向量化执行引擎，采用自研基于代价的优化器(CBO)，可为用户提供极速的任意维度 OLAP 分析和 ad-hoc 查询。

北极九章与镜舟数据库的联合解决方案，从产品层进行打通，双方强强联合。整体方案满足高并发、实时响应等高要求，数据接入延迟可以从小时级缩减到秒级，为用户提供极速分析体验，满足企业内业务端大量灵活的用数需求。

6·1

12.长亮科技携手GBASE南大通用推出金融数据仓库联合解决方案

长亮科技与GBASE南大通用强强联合，携手推出了融合、智能、可靠的国产化金融数据仓库解决方案。

联合解决方案以南大通用GBase 8a MPP Cluster V9为核心构件，辅以长亮科技数据开发平台、数据交换平台、企业级调度平台、数据资产管理平台、数据服务平台，打造海量数据计算及复杂模型分析的技术平台，实现跨业务领域数据的集中采集、存储和共享，全面、及时、准确展现关键系统的运行状况与趋势，助力金融机构全面挖掘数据价值。

双方早已在产品适配认证上提前布局，长亮科技数据仓库解决方案与南大通用GBase 8a MPP Cluster V9已完成联合测试，双方产品完全兼容、运行稳定，充分满足金融机构数据仓库的建设需求。

6·1

13.Databricks38亿美元收购以AI为中心的Okera，以帮助LLM的数据治理

Databricks正在收购以AI为中心的数据治理平台提供商Okera，收购金额据悉为38亿美元。

该公司表示，此次收购预计将提高Databricks的数据治理能力，同时培训和管理大型语言模型(LLM)，如最近发布的Dolly 2.0。

“Okera解决了数据和AI领域的数据隐私和治理挑战。它简化了数据可见性和透明度，帮助组织了解他们的数据，这在LLM时代至关重要，并解决对其偏见的担忧。该公司认为，当涉及到LLM或生成式AI时，数据治理中需要基于AI的方法，因为数据的规模会成倍增加，而偏见等其他问题“超出了传统数据治理平台的范围”。

Okera 的治理平台包括一个 AI 界面，可自动发现、分类和标记敏感数据，例如个人身份信息。Okera还提供了一个自助服务门户，可以快速审核和分析敏感数据使用情况，使组织能够可靠地监控和跟踪数据使用模式，即使数据集的大小呈指数级增长或其中一些是由AI引擎生成的。Okera还致力于开发一种新的隔离技术，该技术可以支持任意工作负载，同时在不牺牲性能的情况下实施治理控制。

6·1

14.Qlik 正式收购 Talend，将数据集成与数据转换、质量和治理功能相结合

Qlik 宣布已完成对 Talend 的收购，扩大了公司对现代企业访问、转换、信任、分析和处理数据的能力。Qlik在数据集成、分析、人工智能和机器学习方面的广泛专业知识与Talend的数据集成和数据质量解决方案相结合，将为客户提供业内最全面的解决方案。

Qlik 和 Talend 解决方案是互补的，扩展了许多重要领域的功能，例如数据质量、转换、应用程序连接和 API 服务。重要的是，Qlik 将继续对几乎任何数据源、目标、架构或方法保持开放，确保客户始终在需要时拥有所需的数据。

数据库

6·1

15.四家伙伴发布基于openGauss的数据库一体机

在openGauss Developer Day 2023上，openGauss持续聚焦内核与架构创新，推出DataPod+DataKit组合和第三代智能优化器ABO，打造全新的数据底座。海量数据、云和恩墨、南大通用、沃趣科技正式发布首批基于openGauss发行版的数据库一体机产品。openGauss社区正式发布openGauss伙伴专业保障服务，首批8家优秀伙伴通过认证成为社区服务伙伴。

openGauss社区将联合伙伴推出“全栈可信”“全栈安全”“开箱即用”“极简运维”的数据库一体机解决方案。本次发布的数据库一体机产品均采用了完全开放的架构设计，基于开放的鲲鹏服务器硬件和openGauss开源数据库，为客户提供开放、安全、自主创新、长期演进的企业级数据库解决方案新选择。

开源3年以来，openGauss已上线7个社区版本，DBV伙伴基于社区发行版发布商业发行版，用户基于社区发行版深度定制的用户自用版，这些版本已覆盖数字基础设施丰富的场景，包括面向关系型的集中式、KV数据库，地理空间数据库，时序数据库等。

6·1

16.PostgreSQL 16 Beta 1 版本发布!

APostgreSQL 全球开发组宣布 PostgreSQL 16 的第一个测试版现已可供下载。此版本包含 PostgreSQL 16 普遍可用时将可用的所有功能的预览，但该版本的某些细节可能会在测试期间发生变化。

作为主要开源关系数据库的下一个主要版本(现已处于测试阶段)，PostgreSQL 16 推进了查询并行性，为查询执行和逻辑复制带来了性能改进。

PostgreSQL 16 还可以将并发批量加载数据的性能提高COPY300%。

此版本还为 x86 和 ARM 架构引入了对使用 SIMD 的 CPU 加速的支持，包括对处理 ASCII 和 JSON 字符串以及数组和子事务搜索的优化。此外，PostgreSQL 16 还为 PostgreSQL 的客户端库 libpq引入了负载平衡。

6·1

17.CockroachDB现在支持Microsoft Azure和多区域部署

由前谷歌员工创立的公司Cockroach Labs表示，其开源、容错的分布式SQL数据库即服务CockroachDB Dedicive将支持Microsoft Azure和多区域部署。

随着对Microsoft Azure的支持增加，CockroachDB Dediced现在将支持所有三个主要的公共云服务提供商，包括Amazon Web Services和Google Cloud。

“企业可以在云提供商或多个云提供商之间进行选择，并且可以轻松地在自己的数据中心和公共云提供商之间混合工作负载，”Cockroach Labs在一份声明中说。

除了在Microsoft Azure上运行之外，CockroachDB Serverless现在还支持多区域部署。

6·1

18.Yugabyte为YugabyteDB 2.18 添加了多区域 Kubernetes支持

Yugabyte在其开源分布式SQL数据库YugabyteDB 2.18的最新更新中添加了多区域 Kubernetes支持以及其他功能。

该更新已经正式发布，为公司的自我管理的数据库即服务YugabyteDB Anywhere增加了多区域Kubernetes支持。

Yugabyte说，为了帮助企业在部署Kubernetes时消除摩擦点，该公司增加了对共享命名空间，增量备份和高达五倍的备份速度的支持。

新的更新包括一个新的智能性能顾问程序，用于优化自我管理的数据库即服务 Yugabyte Anywhere 的索引、查询和架构。

数据安全

6·1

19.IBM 推出端到端量子安全技术，保护政府和企业最有价值的数据

IBM 正在推出新的 IBM Quantum Safe 技术，提供一套全面的工具和功能，并结合 IBM 深厚的安全专业知识，设计为端到端解决方案。

随着量子计算机的不断进步，它们将达到破解世界上最广泛使用的安全协议的能力。认识到这种风险，IBM利用其在密码学，量子计算和关键基础设施方面的广泛专业知识来开发IBM Quantum Safe技术。

这组功能旨在帮助客户通过以下方式为后量子时代做好准备：

IBM Quantum Safe Explorer，使组织能够扫描源代码和目标代码，以定位加密资产、依赖项、漏洞，并构建加密物料清单 (CBOM)。这允许团队查看潜在风险并将其聚合到一个中心位置。

IBM Quantum Safe Advisor 允许创建加密清单的动态或操作视图，以指导修复，并分析加密状态和合规性，以确定风险的优先级。

IBM Quantum Safe Remediator 使组织能够部署和测试基于最佳实践的量子安全修复模式，以了解在准备部署量子安全解决方案时对系统和资产的潜在影响。

IBM还展示了其IBM Quantum Safe Roadmap，以帮助客户了解并支持他们完成这一安全过渡。

6·1

20.RKVST发布区块链支持的解决方案以验证数据的真实性

RKVST是一家来源即服务(provenance-as-a-service)提供商，正在推出Instaproof，使公司能够获得决定信任哪些数据所需的信息。

使用RKVST Instaproof，任何人都可以通过将文件拖到Instaproof上来验证其来源，从而轻松检查他们正在使用的文件。如果文件已向 RKVST 注册，则显示的来源信息可用于确定要信任的文件。

任何文件都可以使用免费帐户向 RKVST 注册，以创建强大的、可验证的、可移植的出处记录，记录谁在什么时候做了什么，并提供原产地和真实性证明。

RKVST 为存储在本地和云中的数据增加了透明度和可追溯性。无论是在Dropbox，OneDrive还是Google Drive上，合作伙伴，供应商和客户都可以立即验证数据。

6·1

21.奇安信成立数据安全分公司新品“奇安天盾”数博会首发

5月26日，2023贵州数博会上，奇安信集团数据安全分公司正式揭牌成立，奇安信集团董事长齐向东出任总经理，同时，奇安信对外发布“奇安天盾”数据安全保护系统。这些举措标志着网络安全国家队全面发力数据安全领域，帮助客户破解“难看清”、“难管好”、“难防住”等难题，开拓市场新蓝海。

奇安信发布了“奇安天盾”数据安全保护系统，它能够基于六全框架：“全链路监测、全穿透识别，全兵种协同、全闭环处置以及全天候控制、全场景防护”，做到三能：“能看清、能管好、能防住”。

本次正式发布的奇安天盾数据安全保护系统，以“数据资产”为核心，将“事件监测、风险分析、策略调整、访问控制”融为一套完整闭环体系，让数据安全风险能看清，内鬼能管好，攻击能防住。

6·1

22.新兴数据安全数据保护商「领信数科」完成超亿人民币B轮融资

近日，领信数科(原杭州熙羚)完成超亿元B轮融资，将主要用于新一代的数字安全产品、数字大模型、智能数字平台等技术研发、供应链升级、数字化运营以及市场拓展等方面投入，力图打造新一代数字安全综合解决方案。

杭州领信数科是一家面向零信任时代的新兴数据安全公司，是云计算和大数据环境下的新一代边界安全的定义者和引领者。公司以安全大数据分析为技术核心，也是用户行为异常分析领域的持续创新企业，尤其是政府应用的业务审计和异常分析方面，拥有丰富的经验和众多的大型案例。

6·1

23.联合国发布隐私增强技术指南，涵盖18个全球典型案例!

联合国大数据和数据科学专家委员(UNCEBD)会发布《隐私增强技术指南》(The PET Guide)。指南重点关注隐私增强技术在官方统计数据中的应用，旨在帮助各国的国家统计局更好地理解和运用隐私增强技术处理敏感数据，提升数据的准确性和安全性，进而助力政府科学合理决策。

指南重点介绍了多方安全计算(sMPC)、同态加密(HE)、差分隐私(DP)、合成数据、分布式学习(联邦学习(FL)和拆分学习(SL)两种)、零知识证明(ZK)、信执行环境(TEE)和安全飞地七种隐私增强技术的技术概况、发展历史、安全模型和使用成本等。

指南详细列举了十八个涉及隐私增强技术的具体案例，涉及跨部门使用、多种技术组合、多国合作参与、公私部门协作等具体场景，涵盖美国、加拿大、欧盟、英国、意大利、荷兰、韩国、印度尼西亚等国家和地区。其中，十五个案例仍处于构思或部署阶段，另外三个已经实际投入使用。

6·1

24.零信任接入和移动安全解决方案提供商「辰尧科技」完成超千万融资

辰尧科技成立于 2021 年 10 月，公司致力于为企业、机构和组织提供领先的零信任接入和移动安全解决方案。通过终端的安全空间技术和零信任接入技术的整合创新，帮助客户实现对内部应用和云服务的安全访问，保护企业数据和应用的安全。公司凭借卓越的产品和服务，在短短两年内成功吸引了众多知名行业客户，行业覆盖金融、交通、公安、司法、政务、军队等。

6·1

25.Salesforce推出Tableau Pulse，将生成式AI引入用户体验

在AI的时代浪潮下，作为CRM行业巨头的Salesforce需要提供安全的生成式人工智能，而领先的数据可视化平台Tableau就是下一个接受转型的目标。Tableau GPT将生成式AI引入用户体验，帮助用户更智能地工作，更快地学习，更好地交流。

Tableau Pulse是一种重新构想的Tableau用户体验，可自动执行数据分析。在Tableau GPT的支持下，用户可以根据个人偏好预测每个用户需要的数据，并自动生成可操作的见解。

Tableau Pulse在Tableau GPT的支持下，与Data Cloud一起为客户提供了新一代分析体验，使用户能够根据相关数据更快地做出决策，将数据和分析的力量带给每个人。

6·1

26.SAP和微软合作提供生成式AI产品，以解决人才缺口问题

SAP和微软利用最新的企业级生成式AI创新，帮助解决客户最基本的业务挑战。

两家公司合作将SAP SuccessFactors解决方案与Viva Learning中的Microsoft 365 Copilot和Copilot以及Microsoft的Azure OpenAI服务集成，以访问分析和生成自然语言的强大语言模型。据这些公司称，这些集成将带来新的体验，旨在改善组织吸引、留住和技能员工的方式。

6·1

27.NVIDIA 与微软合作，为企业的生成式 AI 提供增强功能

英伟达将其 NVIDIA AI 企业软件集成到微软的Azure机器学习中，以帮助企业加速其人工智能计划。

此次集成将创建一个安全的企业级平台，使全球Azure客户能够使用NVIDIA AI Enterprise(NVIDIA AI Enterprise)完全支持的100多个NVIDIA AI框架和工具，快速构建、部署和管理自定义应用程序。

Azure Machine Learning 上的 NVIDIA AI Enterprise 还将提供对最高性能 NVIDIA 加速计算资源的访问，以加快 AI 模型的训练和推理。

借助 Azure 机器学习，开发人员可以轻松缩放应用程序(从测试到大规模部署)，同时使用 Azure 机器学习数据加密、访问控制和合规性认证来满足安全性和符合其组织策略要求。NVIDIA AI Enterprise 通过安全、生产就绪的 AI 功能补充了 Azure 机器学习，并包括访问 NVIDIA 专家和支持。

NVIDIA AI Enterprise 包括 100 多个框架、预训练模型和开发工具，例如用于加速数据科学工作负载的 NVIDIA RAPIDS™。NVIDIA Metropolis加速视觉AI模型开发，NVIDIA Triton推理服务器™支持企业标准化模型部署和执行。

6·1

28.Meta开源大模型：支持4000+语言识别，1100+种语音文本转换

Meta AI 团队宣布开源了一个名为 Massively Multilingual Speech (MMS) 的 AI 模型，声称可以识别 4000 多种语言，比目前已知技术要多 40 倍。以及扩展了文本转语音和语音转文本技术的涵盖范围，从大约 100 种语言到 1100 多种。

根据介绍，现有的最大的语音数据集最多只涵盖 100 种语言;因此为了收集数千种语言的音频数据，Meta 使用了一种非常规的方法 —— 宗教文本录音。“我们转向宗教文本(例如《圣经》)，这些文本已被翻译成许多不同的语言，并且其翻译已被广泛研究用于基于文本的语言翻译研究。这些译本都有公开录音，记录了人们采用不同语言进行阅读的情景。”

作为 MMS 项目的一部分，Meta 公司的研究人员创建了一个超过 1100 种语言的 New Testament 阅读数据集，每种语言平均提供 32 小时的数据。结合其他各种基督教宗教读物的无标签录音，他们还将模型的可用语言增加到了 4000 多种。

6·1

29.英特尔发布Aurora genAI大模型，力争赶超ChatGPT

英特尔公布了自己的生成式 AI 大模型 Aurora genAI。据悉，Aurora genAI参数量高达1万亿，其开发依赖于Megatron和DeepSpeed框架，这些结构增强了模型的强度和容量。而ChatGPT模型参数量是1750亿，这也意味着，Aurora genAI的参数量是ChatGPT的近6倍。

Aurora genAI模型配套了英特尔为美国Argonne阿拉贡国家实验室开发的Aurora超算，性能达到了200亿亿次，是当前TOP500超算冠军Frontier的2倍，后者是全球第一台百亿亿次超算。

Aurora超算共有10624个节点，每个节点2组CPU及6组GPU，CPU是Sapphire Rapids-SP架构，总计21248个，GPU是Intel经典代表作品Ponte Vecchio，总计63744个。同时拥有10.9PB的DDR5内存，1.36PB的HBM CPU内存，8.16PB的HBM GPU内存，峰值带宽分别可达5.95PB/s、30.5PB/s、208.9PB/s。存储系统拥有230PB容量，30TB/s带宽，光看参数的话Aurora超算真的是梦幻级别。