暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MaaS需求强劲AI基础实施亟待改善;Hive 4.0湖仓一体新里程碑;美将限制开源大型;大数据普及文本转SQL;RSAC新品·

353

点击上方蓝字关注我们


行业快讯与友商动态 2024年第14期:




OpenAI公布了最新的GPT-4o,o代表Omnimodel(全能模型)。全能模型、免费、实时语音视频交互成看点。


但是美国两党支持的立法者正在修正《2018年的出口管制改革法案》,初步计划对最先进的专有 AI 模型实施出口管制,大模型领域的自主研发必须提上日程。


ASF发布的 Apache Hive 4.0,标志着数据湖和数据仓库技术进步的一个重要里程碑。而数据湖仓一体专家Dremio公布系列产品更新,包括扩展其Apache Iceberg支持的数据湖仓一体以适应任何部署环境,提供生成式AI工具,包括文本到SQL的翻译,支持AI模型开发的集成等。


在国内新一代人工智能基础设施亟待发展,留下的巨大的市场机会。


本周焦点
1.星环科技荣登“2024福布斯中国人工智能科技企业TOP 50”榜单
2.AI 2.0需要怎样的基础设施?《新一代人工智能基础设施白皮书》给出答案
3.揭秘 Meta 大型 AI 集群:如何构建未来 AI 基础设施


大数据
4.星环科技与惠普联合发布三款AI工作站,为个人和中小企业开启PC端知识库无限可能
5.《AI时代数据架构和战略》白皮书:单一平台上集成完整数据生命周期至关重要
6.ASF发布Apache Hive 4.0,开启大数据处理的下一次演变
7.Confluent扩展Apache Flink功能,简化AI和流处理
8.Databricks通过RAG应用程序和改进的模型服务增强了企业AI
9.Alation推出工作流自动化,主动识别和缩小数据治理差距
10.Cloudera新品允许客户在 Kubernetes 上部署Apache NiFi、Kafka和 Flink集群
11.StarTree推出实时分析能力,实现可观测性和异常检测
12.估值7.5亿美元的Atlan为数据和AI治理平台筹集1.05亿美元


数据库
13.国内首家!星环科技Transwarp ArgoDB完成中国信通院多模数据库产品测试
14.东方国信CirroData-OLAP 全新升级,推出 V3.5.1 版本!
15.开源时序数据库HoraeDB 2.0.0正式发布
16.“五虎”添翼!沃趣QCP数据库云平台 v3.7.1增加多款数据库支持
17.Dremio增加了文本转 SQL工具,新的合作伙伴关系以推动GenAI的发展


数据安全
18.RSAC 2024现场,全球网络安全大厂新品涵盖SASE、安全运营和应用安全等领域
19.AppOmni通过发布零信任态势管理将零信任扩展到应用层


AI
20.腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力
21.OpenAI发布GPT-4o,全能模型、免费、实时语音视频交互成看点
22.突发!美国拟限制「开源 AI 大模型出口」:你或无法使用
23.零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新


本周焦点


1.星环科技荣登“2024福布斯中国人工智能科技企业TOP 50”榜单




近日,福布斯中国公布“2024福布斯中国人工智能科技企业TOP 50”评选结果。星环科技凭借在人工智能及大模型领域的卓越表现,成功跻身榜单,再获行业权威认可,展现了其在人工智能大模型领域的强大实力和创新能力。


福布斯中国正式推出了“2024福布斯中国人工智能科技企业TOP 50评选”活动,在人工智能产业的技术发展、应用场景、产业生态和市场规模等多个方面进行了深入的调研与分析。在本次评选中,超过49%的企业通过“大模型”展现了其在AI客服、机器人、医疗诊断、工业自动化、金融分析和智能驾驶等不同领域的应用实力。


在大模型领域,星环科技拥有一系列AI Infra工具产品供用户使用,从语料获取、清洗及治理的语料开发工具TDS-LLM、知识建模与融合的图谱构建工具TKS,到提供知识多模态存储与服务的大数据基础平台TDH,配合预训练大模型无涯,可以实现内容生成、代码生成、图片及音视频理解及检索。对于有大模型微调和训练需求的企业,星环科技也提供了大模型运营工具Sophon LLMOps,帮助用户快速实现类GPTs应用构建。此外星环科技还推出了知识库产品Transwarp Knowledge Hub,完善了AI从基础设施到应用的产业链条,可以为客户提供端到端的全套AI解决方案。


2.AI 2.0需要怎样的基础设施?《新一代人工智能基础设施白皮书》给出答案



数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和效率的需求,企业应用生成式AI对于MaaS(大模型即服务)的需求,也都给AI基础设施提出了全新要求


AI2.0时代,需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地,其核心要素,如计算、存储、网络以及数据服务都要做精细化的设计和重构,而非简单的服务器或GPU实例堆砌。


《白皮书》明确了新一代AI基础设施的定义:以大模型能力输出为核心平台,集成算力资源、数据服务和云服务,专门设计用于最大限度提升大模型和生成式AI应用的表现:数据准备与管理、大模型训练、推理、模型能力调用、生成式AI应用部署。企业通过新一代AI基础设施开发和运行生成式AI业务和客户应用程序,以及基模型和行业模型的训练与微调。


《白皮书》指出,新一代AI基础设施的建设将降低大模型开发和应用门槛,在政企服务、产业和科研创新等方面创造更大社会价值:面向产业,将加快推进传统产业上下游各个环节的智能化转型,催生新业态、新模式的不断涌现。面向科研,可加速科学实验的自动化和智能化,激发人工智能驱动科学研究(Al forScience)的新范式。面向政务,将原本分散、碎片化的政务应用,通过“一模通办”为政务服务提质增效。


3.揭秘 Meta 大型 AI 集群:如何构建未来 AI 基础设施



Meta 宣布了其雄心勃勃的 AI 未来计划,包括两座拥有 2.4 万颗 GPU 的 AI 集群。本文将分享这些集群的硬件、网络、存储、设计、性能以及软件等方面的细节,揭示 Meta 如何从中提取高吞吐量并保证各种 AI 工作负载的运行稳定性。我们采用这种集群设计来训练 Llama 3 大型语言模型。


一直以来,Meta 都坚定地致力于开放计算和开源技术。这些集群建立在 Grand Teton、OpenRack 和 PyTorch 等开源技术之上,并且持续推动着业界范围内开放式创新的发展。


此次发布仅仅是 Meta 雄心勃勃的基础设施路线图中的一步。在 2024 年底之前,Meta 计划继续扩大其基础设施建设,其中包括 35 万块 NVIDIA H100 GPU,其计算能力相当于近 60 万块H100 GPU的总和。引领人工智能发展意味着对硬件基础设施进行持续投入,基础设施在人工智能的未来中扮演着至关重要的角色。今天,我们将分享有关 Meta 两款包含 24576 块 GPU 的大型数据中心集群的详细信息。这些集群支持我们当前和下一代人工智能模型,例如 Llama 3(它是已公开发布的 LLM Llama 2 的继任者),以及 GenAI 和其他领域的 AI 研究开发。


大数据


4.星环科技与惠普联合发布三款AI工作站,为个人和中小企业开启PC端知识库无限可能




在2024惠普商用AI战略暨AIPC新品发布会上,星环科技联合惠普发布了三款Z系列AI工作站,聚焦AI知识库、智能视觉和大模型服务平台,软硬件的强强联合为AIPC赋智,也用AI为个人和中小企业开启了无限可能。



为了帮助企业级用户安全且高效地分析各类文档,快速构建知识问答应用,星环科技基于惠普Z系列工作站上部署了知识平台Transwarp Knowledge Hub,通过TKH精准的知识管理,配合工作站的强大算力,可满足金融、能源、制造、工程等多领域企业内部不同类型的知识应用需求,从而有效提升企业业务效率和竞争力。星环科技知识平台TKH具备全面、高效、智能的数据处理和知识管理工具,可面向企业级用户提供多模知识构建、多模知识存储与服务、知识工程、知识权限管理、知识问答助手等关键能力。平台内置基于星环自研大模型打造的知识问答应用-无涯·问知,支持用户上传私有文档、表格、图片、音视频等多源数据并进行自动化知识工程,确保企业文档、个人经验文档等资料不出域,同时支持对接外部数据库或实时资讯,构建安全、智能的企业私域大模型。


5.《AI时代数据架构和战略》白皮书:单一平台上集成完整数据生命周期至关重要




Cloudera公布了其调查报告《AI时代数据架构和战略》的结果。调查显示,90%的IT领导者认为在单一平台上集成完整数据生命周期对分析和AI的发展至关重要。调查表明,想要充分发挥AI效能的企业必须满足三个基本必要条件:


基于业务战略的现代数据架构。现代数据架构的关键是拥有可在公有云和和本地无缝运行的单一数据平台。现代数据架构的优点是能够简化数据及分析流程,灵活处理所有类型的数据。


统一数据管理。当今企业需要灵活且可扩展的云管理技术帮助他们将信息转化为洞察。调查显示,阻碍AI模型开发所需的端到端数据管理因素是数据量和数据复杂性、数据安全性,以及治理与合规性。


安全的多功能数据平台。从长远角度看,采用包含本地和公有云部署的混合数据管理方法是首选的数据分析策略。


6.ASF发布Apache Hive 4.0,开启大数据处理的下一次演变



Apache Software Foundation (ASF)发布的 Apache Hive 4.0,标志着数据湖和数据仓库技术进步的一个重要里程碑。


在大数据处理工具领域,Apache Hive 脱颖而出,成为领先的数据仓库工具之一。它能够查询大型数据集,同时通过其类似 SQL 的查询语言提供出色的灵活性。自 2010 年成立以随着 Hive 4.0 的发布,数据仓库工具变得更好了。


来,Hive 已使世界各地的组织能够执行分析并扩展其数据处理能力。它已成为现代数据管理系统架构中的关键组成部分。最新版本具有性能增强、错误修复和其他升级功能。其中一项主要增强功能是能够与 Hive Iceberg 表无缝集成,从而提高查询性能、简化数据集成并提高可伸缩性。该集成包括分支和标记支持、高级快照管理和分区级操作支持。


Hive 4.0 还具有压缩机制,可提高查询性能并优化 Hive ACID 和 Iceberg 表的存储。ACID(Atomicity, Consistency, Isolation, Durability)是一组属性,用于确保数据库系统中事务的完整性和可靠性。借助 Hive 4.0,用户可以获得改进的事务和锁定功能,以增强软件对 ACID 属性的合规性。


Hive 社区创建了为 Apache Hive 量身定制的 Docker 映像。现在,在最新版本的 Hive 中,用户可以支持官方 Apache Hive Docker 映像,以便更轻松地部署和配置。这将帮助用户使用 Docker 容器管理 Hive 实例。


ASF 还引入了一些编译器改进,包括 HPL/SQL 支持、计划查询、反联合支持和列直方图统计信息。用户还可以访问新的和改进的基于成本的优化 (CBO) 规则。编译器改进的目标是优化资源利用率并提高软件的整体效率。


其他一些值得注意的改进包括用于加快查询处理速度的具体化视图、对 Apache Ozone 的支持、用于更好地分发数据和灾难恢复的增强复制功能,以及用于加快数据处理速度的 Apache Tez 和 Apache Hive LLAP 中的运行时优化。


7.Confluent扩展Apache Flink功能,简化AI和流处理



数据流先驱 Confluent 上个月宣布推出 Confluent Cloud for Apache Flink,使用户能够体验 Apache Kafka 和 Flink作为统一的企业级平台。本周,Confluent为该服务添加新功能。


Apache Flink 的托管服务现在具有 AI 模型推理功能,允许用户清理和处理 AI 和 ML 应用程序的实时流数据。此外,Confluent 还宣布了一种自动扩展集群类型,用于日志记录和遥测数据等用例,无需时间要求。


AI 模型推理使团队能够使用简单的 SQL 命令轻松地将 ML 集成到数据管道中。它可用于增强 GenAI 工作负载,以提供更加个性化的客户体验。通过从数据流中提取最重要的记录并总结文本,AI 模型推理还可以为 AI 聊天机器人提供上下文丰富的数据,以提供更准确的输出。


根据 Confluent 的说法,这项新功能可以简化 AI 开发过程。开发人员不必依赖专门的工具和编程语言。相反,他们可以简单地使用他们最熟悉的 SQL 语法。此外,团队现在可以在单个平台上编排数据清理和处理任务。


数据处理和人工智能工作流程之间的无缝协调也应该提高效率并降低操作复杂性。AI 模型推理目前可供部分客户抢先体验。


8.Databricks通过RAG应用程序和改进的模型服务增强了企业AI




Databricks推出 Vector Search 和对 Model Serving 的重大更新,使企业能够轻松构建具有直接在 Databricks Data Intelligence Platform 中提供的本机功能的高质量 RAG 应用程序。


Databricks 宣布重大更新和更多细节,以帮助客户构建生产质量的 GenAI 应用程序:


·Vector Search 正式发布,这是一个无服务器矢量数据库,专为客户构建,用于使用企业数据扩充其 LLM。


·模型服务基础模型 API 将在未来几周内正式发布,它允许您从服务端点访问和查询最先进的 LLM


·对 Model Serving 的主要更新:新的用户界面使部署、服务、监视、治理和查询 LLM 比以往任何时候都更容易;支持其他最先进的模型 – Claude3、Gemini、DBRX 和 Llama3


部署和查询大型 LLM 的性能改进;通过支持跨所有类型的服务终结点的推理表,实现更好的治理和可审计性。


之前还宣布了以下有助于部署生产质量 GenAI 的功能:功能服务正式发布,以便您可以向 RAG 应用提供结构化上下文;灵活的质量监控界面,用于观察 RAG 应用程序的生产性能。


9.Alation推出工作流自动化,主动识别和缩小数据治理差距



Alation推出Alation Workflow Automation,以帮助数据管理员满足企业数据环境日益复杂的数据治理需求。该解决方案利用Alation Automation Bots并扩展了现有的平台工作流自动化功能,以自动执行手动和重复性任务。


Alation Workflow Automation 通过优化从管理到使用的数据治理流程来弥补这些差距。Alation Automation Bots 通过主动检查缺失的安全分类、标题和术语并提示数据管理员采取行动来提高元数据质量。这些规则集和工作流可以进一步定制,以反映组织的独特需求。该解决方案还通过显示规则遵守情况的仪表板提供数据治理进度的可视化。Alation Workflow Automation 消除了扩展数据管理员团队的需要,促进了更快、更可靠的决策,并确保了成本效益,同时在整个企业范围内提供可信且 AI 就绪的数据。


10.Cloudera新品允许客户在 Kubernetes 上部署Apache NiFi、Kafka和 Flink集群



Cloudera推出Cloudera Flow Management–Kubernetes Operator和Cloudera Streaming– Kubernetes Operator,允许客户在Kubernetes应用平台(如由 Kubernetes 提供支持的行业领先的混合云应用平台 Red Hat OpenShift)上部署Apache NiFi、Apache Kafka和Apache Flink 集群。


借助这些即将推出的Kubernetes Operator,客户可以更轻松地在其现有Kubernetes集群上部署端到端数据流功能,并受益于自动扩展、高效的资源管理以及简化的设置和操作。


Cloudera的Data-in-Motion产品在所有企业数据资产之间提供连接组织,为任何目标系统或应用程序提供流数据和实时洞察。Cloudera Flow Management–Kubernetes Operator 和 Cloudera Streaming–Kubernetes Operator 通过利用红帽 OpenShift用户熟悉的成熟运算符模式来降低运营开销。


11.StarTree推出实时分析能力,实现可观测性和异常检测




基于云的实时分析公司StarTree在StarTree Cloud中提供了新的可观测性和异常检测功能,以及Apache Pinot中的矢量搜索功能。


此外,该公司还宣布全面推出 StarTree ThirdEye,提供高级异常检测,并引入写入 API,促进 ELT 管道的实时同步,以及与领先的可视化平台(包括 Tableau 和 Grafana)的集成。


作为领先的实时分析解决方案,StarTree为数百万用户提供了面向用户的应用程序的最新见解。它允许企业及其客户使用实时数据流,根据最新鲜的数据大规模做出关键决策。


12.估值7.5亿美元的Atlan为数据和AI治理平台筹集1.05亿美元




作为数据和人工智能治理领域一支快速增长的力量,Atlan宣布了一轮 1.05 亿美元的 C 轮融资,使 Atlan 的总融资额超过 2.06 亿美元。


这笔新资金出台之际,Atlan的收入在过去两年中增长了 7 倍以上,在竞争性试验中的胜率为 75%,2024 年第一季度的企业销售额增长了400%,因为对 AI 数据就绪和治理的需求猛增。该公司如今的客户群包括思科、欧特克、联合利华、拉尔夫劳伦、福克斯、新闻集团、纳斯达克、NextGen、Plaid 和 HubSpot 等行业巨头。


Atlan 通过其下一代数据和 AI 治理平台应对挑战。它提供了一个技术层,充当企业不同数据基础设施之上的控制平面和协作层,通过编目的元数据有效地将其拼接在一起,以便数据和业务团队可以查找、信任和管理 AI 就绪数据。Atlan 集中了数据管理,将整个组织的数据生产者和使用者联合起来。


数据库


13.国内首家!星环科技Transwarp ArgoDB完成中国信通院多模数据库产品测试




近日,在中国信通院组织的首批“可信数据库”多模数据库产品测试中,星环信息科技(上海)股份有限公司(简称:星环科技)Transwarp ArgoDB顺利完成多模数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性以及高可用六大能力域的相关要求。测试结果表明,该产品在多模数据库的功能完备性、易用性、通用性等方面均符合标准要求。


《多模数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据与区块链工作组(CCSA TC1 WG6)以及大数据技术标准推进委员会(CCSA TC601),联合超过30家企业专家参与编制的技术标准。其包含基本功能、运维管理、安全性、兼容性、扩展性以及高可用六大能力域共33个测试项,其中分为21个必选项和12个可选项。作为业内首个多模数据库技术标准,可为多模数据库的研发、测试以及选型提供参考。


14.东方国信CirroData-OLAP 全新升级,推出 V3.5.1 版本!



近日,东方国信分布式分析型数据库 CirroData-OLAP 全新升级,推出V3.5.1版本。新版 CirroData-OLAP 在产品原有基础上,结合项目现场用户实际使用需求反馈,进行迭代升级,完善了产品功能,并在产品性能、可靠性以及易用性方面大幅提升,同时也修复了之前版本中存在的一些问题,为用户带来全新的数据库操作体验。


CirroData-OLAP V3.5.1 新增功能如下:


●支持全局SQL队列,可以根据segment节点上面的CPU、Memory阈值以及正在运行的SQL数量对后续新进入的SQL进行排队,从而避免系统过载;


●通过外部catalog的方式,支持对低版本的数据的读取,实现了不同版本数据的统一数据视图管理;


●本地加载性能优化,加载速度提升2.2倍;


●远程加载性能优化,加载速度提升5倍;


●支持异地多活容灾部署;


●支持Profile持久化和可视化。


15.开源时序数据库HoraeDB 2.0.0正式发布




蚂蚁集团时序数据库 CeresDB 于 2022 年 6 月正式宣布开源,2023 年 12 月 11 日,将 CeresDB 的核心源代码以 HoraeDB 的品牌捐赠给 Apache Software Fundation(ASF)。


在加入 Apache 后,HoraeDB 需要适配 Apache 开源项目的发布标准,以更高的开源标准(Apache Way)来要求自己,这个过程中存在 Github 仓库迁移、适配 CI/CD、适配镜像发布等大量工作。


经过几个月的改造和适配,我们完成了进入 Apache 后的第一次 Release,并将这个版本命名为 2.0.0,定义为 Apache HoraeDB 的新起点。


16.“五虎”添翼!沃趣QCP数据库云平台 v3.7.1增加多款数据库支持



近日,沃趣科技旗下QCP数据库云平台发布了 v3.7.1正式版本,该版本新增了对5款主流数据库的支持,同时增加了Redo日志管理、智能表空间管理等功能,此外,新版本还进一步优化了使用体验,新增了短信告警、历史电源功率及版本信息展示等功能,帮助企业用户更好地进行多数据库全生命周期的统一管理,保障数据库稳定高效运行。


为了满足更广泛用户对多场景数据库应用的需求,在之前版本中,QCP数据库云平台已支持Oracle、MySQL、TiDB、SQL Server、PostgreSQL、VastBase等国内外主流数据库。


QCP v3.7.1版本新增了对OceanBase、GaussDB、KingBase、OpenGauss、ElasticSearch等5款数据库的支持,大幅扩展了QCP数据库云平台可统一纳管的数据库业务类型,兼收并蓄各类业务场景。


17.Dremio增加了文本转 SQL工具,新的合作伙伴关系以推动GenAI的发展



数据湖仓一体专家Dremio公布系列产品更新,包括扩展其Apache Iceberg支持的数据湖仓一体以适应任何部署环境,提供生成式AI工具,包括文本到SQL的翻译,支持AI模型开发的集成等。


Dremio 总部位于加利福尼亚州圣克拉拉,是一家数据湖仓一体供应商,其工具将数据仓库的结构化数据管理功能与数据湖的非结构化数据管理功能相结合。由于湖仓一体使用户能够组合不同类型的数据以创建大型数据集,从而提供组织运营的完整视图,因此它们是可用于训练 AI 模型和应用程序(包括生成式 AI)的数据的首选存储库之一。


除了Dremio之外,Databricks还是湖仓一体专家,而包括Microsoft和Google在内的科技巨头则提供数据湖仓一体,作为其广泛的数据管理和分析产品的一部分。


数据安全


18.RSAC 2024现场,全球网络安全大厂新品涵盖SASE、安全运营和应用安全等领域



随着网络安全行业持续快速增长,很多厂商全年都在发布产品。不过,主要的网络安全厂商会选择将RSA大会作为重要舞台,推出一系列的新产品和功能。


RSAC 2024本周一在旧金山莫斯科尼中心开幕,微软、谷歌云、思科、CrowdStrike和SentinelOne等公司发布了重要产品公告,Palo Alto Networks、Zscaler、Fortinet和Netskope等公司也宣布了重大更新。


截至当前,RSAC 2024发布的产品主要涵盖了安全运营、SASE、应用安全、威胁情报、电子邮件安全和身份安全等热门领域。


RSAC连续第二年强调利用生成式AI,无论是安全运营团队工具还是其他产品领域。以下是RSAC 2024展示的15家主要网络安全厂商发布和更新的产品。


19.AppOmni通过发布零信任态势管理将零信任扩展到应用层



AppOmni是SaaS安全态势管理(SSPM)的先驱,即将发布AppOmni零信任态势管理 (ZTPM),这是一种独特的解决方案集,通过弥合以网络为中心的零信任(ZT)架构中的关键差距来增强现代基础设施的安全性。


AppOmni 表示,通过将零信任原则扩展到应用程序和SaaS环境,AppOmni提供了管理和减轻内部和外部威胁带来的网络风险所需的可见性和控制力。


新框架提供了对软件即服务 (SaaS) 应用程序中的配置、安全态势和用户行为的可见性和监控级别。它还通过确保从单一管理平台在整个 SaaS 环境中强制实施强制单点登录 (SSO)、多重身份验证 (MFA) 和最低权限配置,从而实现精细访问和配置管理。


通过这些和持续授权功能,AppOmni通过公司标志性的SSPM平台,通过ZTPM将零信任架构扩展到SaaS应用程序和数据。据该公司称,AppOmni在庞大的SaaS部署中发挥零信任的潜力方面比以往任何时候都更进一步。


AI



20.腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力



腾讯研究院正式发布《向AI而行,共筑新质生产力——行业大模型调研报告》,前后历时近1年研究,基于对超过百名各界专家访谈(百人百问),深入剖析了行业大模型的发展背景、应用进展、实现方式、安全与治理,以及未来的发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。


报告综合技术前沿趋势与行业一线实践,主要形成了十个核心问题的分析探讨:


1)大模型的核心突破是什么?


2)为什么需要发展行业大模型?


3)行业大模型是什么?


4)哪些行业的大模型应用发展快?


5)哪些场景的大模型应用发展快?


6)不同行业对大模型有没有共性需求?


7)如何衡量行业大模型是否成功?


8)行业大模型有哪些实现方式?


9)行业大模型如何实现负责任的部署和应用?


10)行业大模型的未来发展方向是什么?


21.OpenAI发布GPT-4o,全能模型、免费、实时语音视频交互成看点



北京时间5月14日凌晨,OpenAI公布了最新的GPT-4o,o代表Omnimodel(全能模型)。20多分钟的演示直播,展示了远超当前所有语音助手的AI交互体验,与外媒此前透露的消息基本重合。


GPT-4o在响应速度方面,几乎解决了延迟问题。GPT-4o的响应音频输入的最短时长为232毫秒,平均响应时长320毫秒,几乎与人类相似。没有使用GPT-4o的ChatGPT语音对话功能平均延迟为2.8秒 (GPT-3.5) 和5.4秒(GPT-4)。


GPT-4o不仅通过缩短延迟极大地提升了体验,还在GPT-4的基础上做了很多升级包括:


·极佳的多模态交互能力,包括语音、视频,以及屏幕共享。


·可以实时识别和理解人类的表情,文字,以及数学公式。


·交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。


·超低延时,且可以在对话中实时打断AI,增加信息或开启新话题。


·所有ChatGPT用户均可免费使用(有使用上限)。


·速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。


22.突发!美国拟限制「开源 AI 大模型出口」:你或无法使用



一个得到美国两党支持的立法者小组公布了一项法案。修正《2018年的出口管制改革法案》,以防止外国对手利用美国人工智能及其他支持性技术以从事其他用途。


该法案将使美国政府更容易对 AI 模型实施出口管制,以避免这项技术落到外国人的手里。


该法案将赋予美国商务部明确的权力,禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。


报道称,美国将开辟一条新的战线,初步计划对最先进的专有 AI 模型实施出口管制,从而保护美国AI远离中国和俄罗斯。


但根据美国现行法律,负责监管美国出口政策的商务部监管开源 AI 模型的出口要困难得多,开源 AI 模型可以随意下载。如果获得批准,该法案将为《国际紧急经济权力法》对开源 AI 出口监管扫清障碍,并明确赋予商务部监管 AI 系统的权力。


23.零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新



在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。


在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。


在产品层,零一万物正式发布了AI办公助手「万知」,可以读长文档、一键生成PPT,这是一个“AI-First版本的Office”。此外,零一万物还公布了其海外生产力应用的商业化数字:总用户接近千万,营收今年预期过亿人民币。


在API层,零一万物API开放平台全球首发,包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案。


零一万物CEO李开复博士还首次分享了零一万物做大模型的两个核心方法论:模基一体——模型与AI Infra并行开发;模应一体——模型与应用并行开发。目前,零一万物是少数完整阐述其大模型战略的公司之一。



扫码关注我们



END



文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论