点击上方蓝字关注我们



行业快讯与友商动态 2024年第13期:
随着大型模型时代的来临,AI基础设施迎来了前所未有的挑战和机遇。倡导各企业携手合作,共同推动大模型基础设施的共识拉通、技术创新与产业升级。AI产业链中也有层级相似,定位于算力与应用之间的“桥梁”角色的基础软件设施层即AI Infra。
拥有11年历史Databricks 公司通过重新定义存储与计算的分离而建立了自己的声誉,使其成为生成式 AI企业的宝贵资源。
国际标准化组织(ISO)与国际电工委员会(IEC)共同发布了一项数据库国际标准——图查询语言标准 GQL(Graph Query Language),标准编号为 ISO/IEC 39075:2024,这是继 ISO 发布第一版 SQL 37年后又一个数据库查询语言。
RAG技术可利用外部数据为LLM等生成式AI模型提供相关上下文答案,被视为替代训练自有LLM或与GPT-4等共享敏感数据的低风险方案。Linux基金会分支宣布OPEA项目,聚焦于推动数据和AI的开源创新,特别是RAG的开放标准,以释放现有数据存储库的重要价值。
本周焦点
1.从IDC、赛迪、创业帮到亿欧,星环科技斩获大模型领域多项大奖
2.大模型建设赋能再升级:大模型基础设施高质量发展研讨会圆满成功
3.详解大模型时代的基础软件堆栈AI Infra
大数据
4.向星辰大海进发!“星环号﹒南信大星”卫星即将发射
5.《2024数商产业场景调研报告》发布,炼数、破圈、合璧成为大大关键词
6.Databricks湖仓一体统一了数据和智能堆栈,以支持生成式AI用例
7.Cloudera发布新一阶段开放数据湖库
8.智领云容器化大数据平台KDP开源!Kubernetes上直接运行大数据平台!
9.Apache Paimon毕业成为顶级项⽬,数据湖步⼊实时新篇章!
10.腾讯协作SaaS全部接入腾讯混元!
11.SAS通过打包AI 模型推进行业解决方案,身定制的轻量级 AI 模型有助于快速部署
12.Gurucul增强了跨多个数据源的联合搜索功能
数据库
13.又一数据库国际标准诞生!GQL图数据库语言重磅发布
14.Redgate推出适用于大型数据库的 Redgate Monitor企业版
15.开源关系型数据库EdgeDB 5.0发布
数据安全
16.明朝万达数据安全合规检查工具V5.0.0全新升级
17.亚信安全数据安全运营平台DSOP新版本发布 注入AI研判升维
18.PVML筹集800万美元,以通过差分隐私技术保护对敏感数据的访问
AI
19.星环科技推出知识库产品 AI PC时代数据交互方式变革
20.Linux基金会通过OPEA 发布促进开源 RAG
21.LLM系统将很快拥有无限的上下文长度
22.Meta推出开源大模型Llama 3:最大底牌4000亿参数,性能直逼GPT-4
23.亚马逊云科技推出业内首个生成式AI合作伙伴能力认证,助力企业布局人工智能+

本周焦点


1.从IDC、赛迪、创业帮到亿欧,星环科技斩获大模型领域多项大奖
作为新一代人工智能产业的核心驱动力,大模型已成为产业数字化与智能化的重要支撑,推动新一轮的科技革命与产业变革。星环科技致力于打造企业级大数据基础软件,围绕数据全生命周期提供基础软件与服务。在大模型领域,星环科技发布了一系列工具产品供用户使用,助力企业抓住大模型时代的新机遇。凭借在大模型领域的深耕布局和技术实力,星环科技备受行业关注,斩获大模型领域多项大奖,堪称荣誉收割机。
星环科技获奖的评选机构包括IDC、赛迪、创业帮、亿欧等,领域涉及政务、金融、地产等行业,以及大模型工具、创新公司等。

2.大模型建设赋能再升级:大模型基础设施高质量发展研讨会圆满成功
中国人工智能产业发展联盟AI Infra工作组举办“大模型基础设施高质量发展专题研讨会”。本次会议汇聚金融、电信、互联网、能源等10余个行业40余家企业,70余位专家前来参会,大家共同就大模型基础设施的核心挑战、落地诉求、建设思路、实践路径等进行了热烈研讨。
中国信通院人工智能研究中心平台与工程化部曹峰主任在致辞中表示,随着大型模型时代的来临,AI基础设施迎来了前所未有的挑战和机遇。倡导各企业携手合作,共同推动大模型基础设施的共识拉通、技术创新与产业升级。AI Infra 工作组组长董昊详细介绍了工作组在2024年的工作目标,将以硬件设施、软件设施为切入,围绕“大模型基础设施”的高质量构建和应用进行工作推进。
在大模型算力设施方向,工作组将面向大模型算力设施,研究如何打造高效率、高可靠、可扩展的大模型算力资源供给。
在大模型软件设施方向,工作组将以大模型软件平台为切入,研究如何构建高性能、高易用的软件设施。
单位代表在讨论中提到未来可在大模型工程化落地、标准的产业指导等方向不断探索。AIIA AI Infra工作组在2024年将致力于推动大模型基础设施的高质量发展,通过技术研究、标准编制、政策研究等工作,促进供需对接和应用落地。

3.详解大模型时代的基础软件堆栈AI Infra
类比计算机系统的基础软件层以及云计算三层架构的PaaS层级,我们认为,AI产业链中也有层级相似,定位于算力与应用之间的“桥梁”角色的基础软件设施层即AI Infra。
新一轮生成式AI浪潮,对于上层应用而言机遇与挑战并存,而AI Infra作为必要的基础设施,我们认为其技术及商业发展前景的确定性或更强。
本文我们聚焦AI Infra,揭示其内涵并总结目前国内外项目的商业化进展,再从工作流视角详细梳理各环节及代表厂商。我们认为,AI Infra是AI产业必不可少的基础软件堆栈,“掘金卖铲”逻辑强、商业潜质高,建议投资者持续关注AI Infra相关投资机会。

大数据


4.向星辰大海进发!“星环号﹒南信大星”卫星即将发射
今年4月24日是第九个“中国航天日”,致敬中国梦,航天梦,星环科技冠名的我国第一颗商业红外气象卫星“星环号﹒南信大星”也即将发射!
4月21日,星环科技作为上海蔚星数据科技有限公司战略合作伙伴冠名的“星环号﹒南信大星”卫星命名仪式在上海成功举行,星环科技创始人、CEO孙元浩和蔚星科技董事长、首席技术官沈学民共同为合作揭牌,虹口区科协副主席杨青松、南京大学上海校友会会长朱振东等嘉宾共同见证了这一重要时刻。星环科技冠名的“星环号﹒南信大星”卫星预计将于5月在甘肃酒泉卫星发射中心正式发射升空,开启其探索宇宙的壮丽征程。

5.《2024数商产业场景调研报告》发布,炼数、破圈、合璧成为大大关键词
2024未来数商大会发布《2024数商产业场景调研报告》,形成行业观察和建议,并收录了“乘数榜”案例,分析了当前数据要素在场景中应用的基本情况,并提出加强数商政策顶层设计、推动数商产业生态建设、加强产业人才培养等初步建议。
报告认为,在应用成效方面,参与调研的案例平均降低成本29%,提升营收22%。在调研数据类型上,74.2%的案例调用了企业数据,62.9%的案例调用了公共数据,近半数的案例调用了两种及以上类型的数据,12.3%的案例同时调用了公共数据、企业数据、个人数据。其中公共数据的来源85.7%为授权运营。
从数据用量来看,半数以上的案例年平均调用数据次数超100万次,调用1亿次以上的场景主要分布在金融服务、城市治理、商贸流通和交通运输领域。
浙江省数字经济学会副秘书长楼晨晓在解读《报告》时,提出“炼数、破圈、合璧”三大关键词。

6.Databricks湖仓一体统一了数据和智能堆栈,以支持生成式AI用例
Databricks 已推出将数据驱动的人工智能集成到统一堆栈中而量身定制的平台。拥有11年历史Databricks 公司通过重新定义存储与计算的分离而建立了自己的声誉,使其成为生成式 AI企业的宝贵资源。
在 Databricks 版本的数据湖仓一体中,存储和计算可以来自不同的供应商,为客户提供更广泛的性价比功能选择。Databricks 的数据湖仓一体体系结构旨在为客户提供更简单的解决方案来管理其端到端分析数据资产。
“从历史上看,数据堆栈和 AI 堆栈有不同的孤岛或不同的技术堆栈,”Databricks 数据管理高级总监 Jason Pohl说。“现在,这些都与湖仓一体结合在一起,当你训练模型时,能够在开放数据集上以分布式方式进行,Lakehouse 为此提供了便利。”
除了提供来自不同供应商的存储和计算之外,Databricks 还支持将端到端数据管理转移到端到端数据治理的过程。该公司通过其 Unity Catalog(存储在分布式数据库中并托管在 Databricks 控制平面中的元数据)来促进这一点。

7.Cloudera发布新一阶段开放数据湖库
企业人工智能数据公司Cloudera 发布新一阶段私有云开放数据湖库,将彻底变革本地数据体验,以实现大规模可信分析和AI。通过新一轮的增强功能,Cloudera 成为可在公有云和私有云同时提供Apache Iceberg开放数据湖库的厂商,助力客户利用数据释放企业的AI潜力。
Cloudera 通过为私有云提供Apache Iceberg,助力企业克服上述困难,并快速扩大企业AI部署规模,为企业创造更大价值。Apache Iceberg是一种适用于庞大分析表的高性能开源格式。通过将该解决方案应用于私有云,企业能够将AI应用于云端和本地的大量关键任务数据,最终创造出新的应用。Cloudera 目前已成为能够运行成功隔离的大语言模型(LLM)部署的公司,在为客户提高安全性和数据隐私性的同时,也为其带来更高的性能和更低的运营成本。

8.智领云容器化大数据平台KDP开源!Kubernetes上直接运行大数据平台!
智领云自主研发的首个完全基于Kubernetes的容器化大数据平台Kubernetes Data Platform (简称KDP)开源啦!开发者只要准备好命令行工具,一键部署Hadoop、Hive、Spark、Kafka、Flink、MinIO ...就可以创建大数据平台。
在高级安装模式下用户可在现有的K8s集群上集成运行大数据组件不用额外单独建设大数据集群。在Kubernetes上运行大数据平台有三个好处:
第一,更高效的大数据组件集成:KDP提供标准化自动化的大数据组件部署和配置,极大地缩短了大数据项目开发和上线时间;
第二,更高效的大数据集群运管:KDP通过大数据组件与K8s的集成,在K8s之上搭建了一个大数据组件管理抽象层,标准化大数据组件生命周期管理,并提供UI界面进一步提升了部署、升级等操作的效率;
第三,更高的集群资源利用率:利用K8s的资源管理和配额机制,与其它系统共享K8s资源池,精细化资源管理,对比传统大数据平台约30%左右的资源利用率,KDP可大幅提升至60%以上。

9.Apache Paimon毕业成为顶级项⽬,数据湖步⼊实时新篇章!
开源软件基金会 Apache Software Foundation(ASF)宣布 Apache Paimon 毕业成为 Apache 顶级项目(TLP)。Apache Paimon 在构建实时数据湖与流批处理技术领域取得了重大突破,数据湖步入实时新篇章!
Apache Paimon 是一个湖格式,结合 Flink 及 Spark 构建流批处理的实时湖仓一体架构。Paimon 创新的结合湖格式与 LSM 技术,给数据湖带来了实时流更新以及完整的流处理能力。

10.腾讯协作SaaS全部接入腾讯混元!
企业微信、腾讯会议、腾讯文档、腾讯乐享、腾讯电子签、腾讯问卷、TAPD、腾讯云AI代码助手等腾讯协作SaaS产品,已全部接入腾讯混元大模型。
在企业内部学习和培训场景中,腾讯乐享将大模型能力与企业内部知识结合,用AI助手辅助学习,提升知识传递的效率;在电子合同场景下,腾讯电子签借助大模型和AI能力,提升合同起草、审阅效率,智能筛查风险;在问卷调研场景中,腾讯问卷打造了全流程的AI解决方案,覆盖问卷设计、投放、回收、分析环节,大幅提升调研质量与效率 。在开发场景下,腾讯云AI代码助手基于腾讯专业编码模型,面向开发者、开发团队及企业客户提供安全合规、高粘度体验的编码场景AIGC服务。
在协同办公场景下,腾讯会议将冗杂的会议纪要、课程笔记、待办等事项交给AI小助手与智能录制,让参会者在会中有效提升专注度,让沟通更高效;腾讯文档依托大模型能力让用户通过一句话指令即可通过AI智能助手,快速处理各种文档、高效创作。

11.SAS通过打包AI 模型推进行业解决方案,身定制的轻量级 AI 模型有助于快速部署
数据和人工智能解决方案的先驱SAS为个人许可证引入了轻量级的、行业特定的人工智能模型,为组织提供了易于部署的人工智能技术,以无与伦比的效率生产现实世界的用例。
SAS可以发挥其数十年的专业知识,为全球知名的金融、医疗保健和制造品牌以及政府机构应用可扩展且值得信赖的人工智能模型。
在当今的市场中,模型的消费主要集中在用于生成式 AI 的大型语言模型 (LLM) 上。实际上,LLM 只是 AI 实际生产部署和企业决策建模需求的一小部分。通过新产品,SAS正在超越LLM,为跨欺诈检测、供应链优化、实体管理、文档对话和医疗保健支付完整性等用例的行业提供经过行业验证的确定性AI模型。
与繁琐且耗时的传统 AI 实施不同,SAS 的行业特定模型专为快速集成而设计,使组织能够实施值得信赖的 AI 技术,并加速实现切实的好处和可信的结果。

12.Gurucul增强了跨多个数据源的联合搜索功能
安全分析领域的领导者 Gurucul 宣布增强其联合搜索功能。Gurucul 联合搜索使用户能够从单个控制台跨任何数据源运行查询,包括数据湖、云对象存储、数据库、身份系统、威胁情报源和 SIEM(包括 Splunk)。
这种通用搜索功能使用熟悉的语法和工作流,通过显著增加安全分析师可用的数据并为安全调查添加上下文,使安全分析师更加高效。由于联合搜索将数据保留在其所在的同一位置,因此用户可以保持数据的合规性和所有权,并降低数据传输和引入成本。
Gurucul 联合搜索的其他好处包括:
·单一控制台 – 单一搜索控制台,具有适用于所有数据安全性和可观测性来源的强大功能,包括保存的查询、UI 驱动的查询更新、属性摘要等。
·更快的调查 – 无需前期数据转换和引入即可加快调查速度。
·更快实现价值 – 在几分钟内添加新的联合数据源,以获得强大的数据洞察力和快速响应时间。
·所有权和合规性 – 使数据可用于分散式威胁检测,同时让用户保留该数据的所有权并存储它以满足合规性标准和预算需求。
·报告 – 针对任何分散的数据构建强大的自定义报告,以获得可操作的见解,并利用广泛的报告功能,例如日程安排、电子邮件、下载和导出。

数据库


13.又一数据库国际标准诞生!GQL图数据库语言重磅发布
国际标准化组织(ISO)与国际电工委员会(IEC)共同发布了一项数据库国际标准——图查询语言标准 GQL(Graph Query Language),标准编号为 ISO/IEC 39075:2024。这是继 ISO 发布第一版 SQL 37年后又一个数据库查询语言。它是一种专为属性图(Property Graph)模型设计的图查询语言,致力于为图数据库提供一个统一的查询和操作语言。
GQL 标准的发布对图数据库领域和数据管理有着极其重要的意义和深远的影,不仅为用户/开发者/社区提供了明确的参考指南,也为企业采用和实施图数据库技术提供了可靠的标准支持。GQL 标准对于统一图数据库语言、促进技术进步、降低学习门槛、增强软件的通用性和提高数据处理效率等方面都具有重要作用。

14.Redgate推出适用于大型数据库的 Redgate Monitor企业版
端到端数据库 DevOps 提供商 Redgate 推出了其广受欢迎的数据库监控工具的企业版,提供了一系列新功能,以应对大型组织面临的规模和复杂性挑战。
Redgate Monitor Enterprise 提供最全面和最先进的功能,用于监控大型复杂资产、优化性能以及使用单一的多合一工具确保安全性、合规性和高可用性。
Redgate Monitor 于 2008 年作为 SQL Monitor 推出,现已发展成为一种受欢迎的数据库监控工具,提供即时问题诊断、可自定义警报、无缝扩展以及混合资产的单一概览视图,无论是在本地还是在云中。Redgate Monitor Enterprise 在此基础上进一步构建,专为需要超出典型监控的高级功能的大型组织量身定制。

15.开源关系型数据库EdgeDB 5.0发布
EdgeDB是一个使用通过独特的数据模式增强的PostgreSQL查询引擎的开源数据库。EdgeDB 5.0的亮点是从传统的数据库结构向更动态的“分支”模型转变,将数据库视为“分支”,类似于软件开发中常用的版本控制系统。
EdgeDB 5.0使得开发人员可以像管理代码更改一样,灵活地管理数据库模式的变化,从而促进更加集成和流畅的工作流程。引入的关键命令包括创建、复制、重命名和删除分支,并将它们重新基于代码分支的更新进行调整。
EdgeDB 5.0的其他突出新功能之一是更新的pgvector扩展,现在包括对Hierarchical Navigable Small Worlds (HNSW)索引的支持。这些索引增强了向量操作的性能,对涉及复杂查询和大型数据集的应用程序至关重要。
此外,EdgeDB 5.0还简化了向量索引的配置,使用户更容易根据其需求优化数据库性能。
此外,EdgeDB 5.0在其认证机制方面引入了重大改进,包括无密码选项,例如WebAuthn和基于电子邮件的“魔法链接 magic links”,以及对流行平台如Slack和Discord的OAuth支持。

数据安全


16.明朝万达数据安全合规检查工具V5.0.0全新升级
明朝万达推出了Chinasec(安元)数据安全合规检查工具。该系统能够支持用户对标现有基础的等保、数据安全法以及各行业的数据分类分级实践标准与数据安全管理行业管理规定,提前对办公终端电脑、服务器环境中存量数据文件进行合规性、安全性自检,提前发现数据安全管理的风险,并由用户进行响应的合规性处置,帮助企业用户平衡敏感数据资产的生产效率与合规风险。除此之外本系统还支持协助监管机构、企业内部审计部门等对目标企业用户高效的进行数据安全合规性检查,并输出数据安全合规性检查报告。
经过两年多的精心打磨与客户的严苛验证,“Chinasec(安元)数据安全合规检查工具”全新V5.0.0版本正式问世!
这次新版本带来了前所未有的升级与革新:扫描引擎大幅进化,文档格式支持更广,重磅推出数据安全合规检查工具SaaS化支持服务平台,软件形态全面革新,适配更多使用场景!
·全新软件形态,让操作更流畅,体验更极致;
·升级后的扫描引擎,扫描速率极大提升,更多文档格式的支持,让你的数据安全合规检查工作如鱼得水,游刃有余;
·增加SaaS化支持服务平台,方便尚未购买服务端的客户,轻松获取最新的扫描策略和最新的数据安全合规检查工具。客户无需投入资金购买和维护服务端设备,即可享受专业级的合规服务。

17.亚信安全数据安全运营平台DSOP新版本发布 注入AI研判升维
亚信安全推出数据安全运营平台DSOP全新版本,正是为满足企业对数据安全的高度需求而设计。这款平台以其卓越的能力和技术优势,为企业的数据安全保驾护航,带来了无可比拟的价值。
核心功能包括:
资产梳理:DSOP平台能够自动识别和分类企业的多类型数据资产,包括数据库、文件系统和API资产,为企业提供了一个清晰的数据资产清单,帮助企业更好地管理和保护其宝贵的数据资源。
数据接入:平台支持多元异构数据采集,能够轻松接入各种安全设备和应用的日志数据,实现数据的统一管理和分析,打破数据孤岛,提供全面的数据视角。
分析研判:DSOP利用先进的AI技术和关联分析引擎,对收集到的数据进行深入分析,快速识别潜在的安全威胁和异常行为,为企业提供精准的安全告警和风险评估。
事件响应处置:平台具备智能的事件响应能力,能够与多种安全防护设备联动,自动化执行安全策略,如终端锁定和数据脱敏,从而有效降低安全事件的影响。
安全可视化:DSOP提供了多维度的安全态势大屏和报表,直观展示数据安全状态和风险趋势,帮助企业快速把握安全动态,做出明智的决策。
多租户管理:平台支持多租户模式,为不同部。

18.PVML筹集800万美元,以通过差分隐私技术保护对敏感数据的访问
PVML是一家以色列初创公司,正在使用人工智能技术来增强对组织最敏感数据的访问。该公司今天表示,已经完成了800万美元的种子轮融资。
这家初创公司创建了一个安全的数据访问平台,可以分析机器学习并将其应用于最敏感的数据。它的系统基于数学保证的私有输出的概念,通过在其计算中引入随机化来实现的。
通过其平台,PVML可以帮助公司连接、提供对多个数据源的访问并保证其隐私,这意味着即使是最敏感的数据也可以获得实时、实时的见解。

AI


19.星环科技推出知识库产品TKH AI PC时代数据交互方式变革
星环科技推出知识库产品Transwarp Knowledge Hub(以下简称TKH),旨在为企业提供一个全面、高效、智能的数据处理和知识管理解决方案。TKH拥有从原始数据导入、多模态数据存储、知识构建(抽取、表达、对齐、融合)、知识检索召回、大模型底座、知识应用等端到端的产品,可提供多模知识构建、多模知识存储与服务、知识工程、知识权限管理与灾备、大模型应用助手等关键能力。
企业用户利用TKH平台,可以将企业内部数据、个人经验数据和公开信息数据转化为知识,让数据平台更加智能化,同时可以将AIPC端和云端资源联动,确保数据安全性。个人经验数据的知识转化和不断的模型微调让知识库建设更具个人化,真正实现个人化、专家级大模型应用。
在大模型领域,星环科技拥有一系列AI infra工具产品供用户使用,从语料获取、清洗及治理的语料开发工具TDS-LLM、知识建模与融合的图谱构建工具TKS,到提供知识多模态存储与服务的大数据基础平台TDH,配合预训练大模型无涯,可以实现内容生成、代码生成、图片及音视频理解及检索。其中,大数据基础平台TDH通过分布式向量数据库Hippo、全文搜索库Scope、图数据库StellarDB、时序数据库Timelyre、文件系统TDFS以及分析型数据库ArgoDB等组件满足各类场景下结构化数据、半结构化数据和非结构化数据的统一存储管理与服务。对于有大模型微调和训练需求的企业,星环科技也提供了大模型运营工具Sophon LLMOps,帮助用户快速实现类GPTs应用构建。此次推出TKH知识应用,完善了AI从基础设施到应用的产业链条,可以为客户提供端到端的全套AI解决方案。

20.Linux基金会通过OPEA 发布促进开源 RAG
Linux基金会的一个分支宣布企业 AI 开放平台 (OPEA),这是一个新的社区项目,旨在推动数据和 AI 的开源创新。OPEA的一个特别重点是围绕检索增强生成(RAG)开发开放标准,该组织表示,该标准具有“从现有数据存储库中释放重要价值”的能力。
OPEA由LFAI和Data Foundation创建,LFAI和Data Foundation是Linux基金会的分支,成立于2018年,旨在促进供应商中立的开源AI和数据技术的发展。OPEA 正好符合这种范式,其目标是促进灵活、可扩展和开源生成式 AI 技术的开发,尤其是围绕 RAG 的技术。
RAG 是一种新兴技术,可将外部数据用于大型语言模型 (LLM) 和其他生成式 AI 模型。RAG 不是完全依赖容易编造事情的预训练 LLM,而是帮助引导 AI 模型提供相关的上下文答案。它被视为一种风险较小且耗时的替代方案,可以替代训练自己的 LLM 或直接与 GPT-4 等 LLM 共享敏感数据。
虽然GenAI和RAG技术迅速出现,但它也导致了“工具,技术和解决方案的碎片化”,LF AI和AI基金会说。该小组打算通过与行业合作来解决这种碎片化问题,“创建标准化组件,包括框架、架构蓝图和参考解决方案,以展示性能、互操作性、可信度和企业级就绪性。
RAG工具和技术的出现将成为OPEA寻求创建标准化工具和框架的核心重点,LF AI和Data执行董事Ibrahim Haddad说。

21.LLM系统将很快拥有无限的上下文长度
很快,关于哪个模型拥有最大上下文长度的争论似乎将变得无关紧要。Microsoft、谷歌和 Meta 都朝着这个方向大步前进——让上下文长度无限。
虽然目前所有的 LLM 都在 Transformer 上运行,但它可能很快就会成为过去。例如,Meta 推出了 MEGALODON,这是一种神经架构,旨在实现具有无限上下文长度的高效序列建模。
MEGALODON 旨在克服 Transformer 架构的局限性,例如其二次计算复杂性和长度泛化的有限感应偏差。该模型在 70 亿个参数和 2 万亿个训练令牌的规模上表现出卓越的效率,在训练损失方面优于 Llama 2 等其他模型。
它引入了关键创新,例如复杂的指数移动平均 (CEMA) 组件和时间步长归一化层,可提高长上下文预训练和数据效率。这些改进使 MEGALODON 能够在各种任务中表现出色,包括指令微调、图像分类和自回归语言建模。
最有可能的是,即将推出的 Meta 的 Llama 3 将基于 MEGALODON 架构,使其具有无限的上下文长度。
同样,谷歌研究人员引入了一种名为Infini-Attention的方法,该方法将压缩记忆整合到普通注意力机制中。这篇题为“不留任何上下文”的论文说,Infini-Attention将压缩记忆整合到普通注意力机制中,并将掩蔽的局部注意力和长期线性注意力机制结合在一个Transformer块中。
这种方法将屏蔽的局部注意力和长期线性注意力机制结合在一个 Transformer 块中,允许现有的 LLM 使用有限内存和计算处理无限长的上下文。
该方法可以自然扩展以处理数百万长度的输入序列,并且在长上下文语言建模基准和书籍摘要任务上优于基线。1B 模型在高达 5K 序列长度的密钥实例上进行了微调,成功解决了 1M 长度问题。

22.Meta推出开源大模型Llama 3:最大底牌4000亿参数,性能直逼GPT-4
美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。Meta首席执行官扎克伯格表示,Llama 3有8B和70B两个版本,大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。
此外,Meta还同时发布了AI助手的更新版本。该助手将在Meta的Facebook、Instagram、WhatsApp和Messenger应用以及一个新设立的独立网站Meta.ai中获得更突出的地位,让Llama 3能够更直接地与微软支持的OpenAI的热门产品ChatGPT竞争。

23.亚马逊云科技推出业内首个生成式AI合作伙伴能力认证,助力企业布局人工智能+
4月23日 亚马逊云科技宣布推出生成式AI合作伙伴能力认证,通过认证帮助合作伙伴更好地利用亚马逊云科技全托管生成式AI服务Amazon Bedrock、一键式基础模型中心Amazon SageMaker Jumpstart、机器学习推理芯片Amazon Inferentia和机器学习训练芯片Amazon Trainium等领先的AI技术,为企业提供全方位的服务、工具和量身定制的解决方案,帮助企业更快地应用生成式AI、打造“人工智能+”时代的竞争优势。
在全球,首批获得该能力认证的亚马逊云科技合作伙伴网络成员已达40余家,包括英伟达、埃森哲、德勤、凯捷、Anthropic、AI21 Labs和Stability AI等。国内合作伙伴包括神州泰岳、伊克罗德和Zilliz等也正在积极申请该能力认证。

商务合作
扫码关注我们

END





