暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

大模型生态哪个省最强?微调大模型是个大生意;超级图、搜索引擎嵌入大模型、消息队列无服务器化、零信任方案、一半的企业采用大模型?

210



点击上方蓝字关注我们



行业快讯与友商动态 2024年第12期:

模型微调是一个大生意。随着人工智能和深度学习技术的快速发展,越来越多的企业和组织意识到了模型微调的重要性。模型微调可以提高机器学习模型的准确性和性能,帮助企业更好地理解和应用数据。


因此,越来越多的公司如OpenAI开始投入资源和资金进行模型微调,以提升其核心业务的竞争力。同时,一些专门从事模型微调服务的公司也在迅速崛起,为客户提供高质量的模型微调和优化解决方案。可以预见,模型微调将成为一个庞大的产业,为企业提供更多的机会和挑战。在这个过程中,只有不断地学习和改进,才能在激烈的市场竞争中脱颖而出。


Hasura发布GraphQL数据管理平台V3测试版,集成超级图技术,提供以领域为中心的超图建模框架,分布式超级图执行引擎和开源数据连接器,简化多源数据访问和API集成。


Elasticsearch宣布支持Cohere的文本嵌入模型,提供高效的int8嵌入,优化性能并降低内存成本,实现高达4倍的内存节省和30%的搜索速度提升,同时保证搜索质量。


本周焦点
1.IDC“政务大模型厂商图谱”出炉,国内实力星环科技华为企业纷纷入围
2.117个大模型通过国家网信办备案,北上广占比八成
3.上海积极培育大模型生态成效初显,20余款大模型通过相关部门备案


大数据
4.划重点!2024年我国数据工作明确8大重点任务
5.推进城市全域数字化转型,国家数据局面向社会公开征求意见
6.Elastic将Cohere文本嵌入模型引入Elasticsearch
7.Gretel 发布全球最大的开源文本转SQL数据集,加速AI模型训练
8.阿里云ApsaraMQ 率先完成消息队列全系Serverless化,携手Confluent发布新产品
9.腾讯云存储面向AIGC全面升级 搭载全面自研存储引擎
10.Timescale收购PopSQL,为PostgreSQL开发人员带来现代的协作式SQL GUI
11.Coalesce筹集了5000万美元以扩展数据转换平台


数据库
12.选信创厂商全景地图推出,国产替代实力企业星环科技入围
13.开源GraphQL数据管理语言初创公司Hasura推出超级图功能,简化复杂API数据集成
14.百度向量数据库VectorDB免费测试开放
15.面向数据库的操作系统:80岁的PostgreSQL之父宣布推出DBOS Cloud
16.亚信安慧AntDB-T数据库重分布的实现原理
17.向量数据库企业Pinecone 推出合作伙伴计划,将更多公司带入AI堆栈
18.企业数据库CrateDB宣布在Google Cloud Marketplace上可用
19.Aerospike 筹集1.09 亿美元,加速数据库开发


数据安全
20.Trellix推出全新AI驱动的零信任解决方案,以增强网络安全
21.55%企业今年采用GenAI,GenAI 集成安全将大幅增加


AI
22.OpenAI发布新AI微调工具,“绝大多数组织将开发定制模型”
23.Apache Cassandra数据库企业DataStax收购Langflow,扩展GenAI应用开发组合
24.英特尔推出最新的人工智能芯片Gaudi 3,三大优势与英伟达竞争升温




本周焦点




1.IDC“政务大模型厂商图谱”出炉,国内实力星环科技华为企业纷纷入围


近日,国际权威IT咨询机构IDC发布《中国大模型在数字政府应用市场分析,2024》报告,对数字政务大模型的应用场景、供应商能力布局以及未来展望进行了深入分析,并对技术供应商的发展方向提出建议。星环科技成功入选IDC“政务大模型厂商图谱”。


IDC在报告中指出,大模型在政府行业的应用正逐渐展现出其巨大的潜力和价值。政务大模型作为在基础大模型基础上进行微调而成的专用模型,更加贴合政府行业的需求和特性,为政府决策、公共服务、政策制定等方面提供了强大的支持。


2.117个大模型通过国家网信办备案,北上广占比八成

4月2日,国家互联网信息办公室关于发布了“生成式人工智能服务已备案信息”。


截止至2024年3月28日,通过国家网信办备案的大模型名单有117个,包括文心一言、智谱清言、云雀大模型、百应、紫东太初大模型开放平台、abab、日日新、书生·浦语、星火认知大模型、360智脑大模型等。其中,北京51个,上海24个,广东19个,北上广的大模型数量占全国总模型数量的80%。


3.上海积极培育大模型生态成效初显,20余款大模型通过相关部门备案

上海积极培育开放活跃的大模型生态,出台了《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》等政策文件,打造全国首个大模型创新生态社区“模速空间”,在算力调度、开放数据、评测服务、金融服务、综合服务等方面给予全方位服务保障。根据《生成式人工智能服务管理暂行办法》要求,有关部门组织开展我市生成式人工智能服务备案工作,目前已有24款大模型通过备案。



大数据



4.划重点!2024年我国数据工作明确8大重点任务

2024年,国家数据局将从健全数据基础制度、提升数据资源开发利用水平、以数字化赋能高质量发展、促进数据科技创新发展、优化数据基础设施布局、强化数据安全保障能力、提升数据领域国际合作水平和发挥试点试验的引领作用等8方面推动数据工作。


5.推进城市全域数字化转型,国家数据局面向社会公开征求意见


日前,国家数据局研究起草的《深化智慧城市发展 推进城市全域数字化转型的指导意见》面向社会公开征求意见。征求意见稿提出深入实施城市云网强基行动,推进千兆城市建设,探索发展数字低空基础设施等系列行动。


征求意见稿指出,城市作为国家经济发展、社会治理、公共服务的单元,是推进数字中国建设的综合载体。推进城市智慧化发展、数字化转型,是面向未来构筑城市竞争新优势的关键之举,也是推动城市治理体系和治理能力现代化的必然要求。


征求意见稿提出的主要目标是,到2027年全国城市全域数字化转型取得明显成效,形成一批横向打通、纵向贯通、各具特色的宜居、韧性、智慧城市,有力支撑数字中国建设。城市数字经济创新活跃,数字治理高效精细,数字服务畅享便捷,数字应急韧性安全,生态环境智慧绿色;适数化制度机制实现突破创新、长效化运营确保可持续发展、协同化发展格局联动内外;数字设施大动脉畅通优化,数据资源大循环活力释放,城市发展成果惠及全民。


6.Elastic将Cohere文本嵌入模型引入Elasticsearch

Elasticsearch 的开发公司 Elastic宣布,Elasticsearch 开放推理 API 现在支持 Cohere 的文本嵌入模型。这包括 Elasticsearch 原生支持高效的 int8 嵌入,从而优化性能并降低企业场景中常见的大型数据集的语义搜索的内存成本。


通过这种集成,Elasticsearch 开发人员可以立即获得性能提升,包括节省高达 4 倍的内存和高达 30% 的搜索速度,而不会影响搜索质量。


Elasticsearch在大型数据集上提供了强大的矢量检索性能,其对具有int8压缩的Cohere嵌入v3模型的原生支持有助于提高语义搜索和检索增强生成(RAG)的企业级部署的性能、效率和搜索质量。


7.Gretel 发布全球最大的开源文本转SQL数据集,加速AI模型训练

合成数据领域的领导者 Gretel 发布了世界上最大的开源文本到 SQL 数据集,以解锁企业中 AI 的新可能性。Gretel 的数据集可在 Hugging Face 上使用,并在 Apache 2.0 许可下发布,由超过 100,000 个带有 SQL 元数据的高质量合成文本到 SQL 示例组成,涵盖 100 个垂直领域。


通过访问 Gretel 的开源高质量合成数据集,开发人员可以训练 AI 模型,使业务用户能够从关键企业数据源中提取价值,从而加快整个企业的 AI 计划。


“获取高质量的训练数据是使用生成式人工智能进行构建的最大障碍之一。Gretel通过为开发人员提供高质量的合成文本到 SQL 数据,使他们能够创建能够理解自然语言查询并生成 SQL 查询的 AI 模型。这使整个组织的用户能够轻松访问复杂的数据库、数据仓库和数据湖并从中获取见解,而无需学习 SQL 或依赖技术团队。我们很高兴开发人员能够利用我们的数据集进行旋转,并在此基础上进行构建。


8.阿里云ApsaraMQ 率先完成消息队列全系Serverless化,携手Confluent发布新产品

阿里云云消息队列产品升级全新品牌 ApsaraMQ,将围绕“高弹性低成本、更稳定更安全、智能化免运维”三大方向持续拓展突破,产品全面 Serverless 化,帮助用户降本 50%。


同时与全球消息流领导者 Confluent 达成战略合作,推出云消息队列 Confluent 版,为企业和开发者提供更高效更安全的消息流服务,该产品已经在阿里云中国站与国际站同步上线。


9.腾讯云存储面向AIGC全面升级 搭载全面自研存储引擎

腾讯云宣布云存储解决方案面向AIGC场景全面升级,能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训练效率均提升一倍,需要的时间缩短一半。


据介绍,腾讯云AIGC云存储解决方案主要由对象存储COS、高性能并行文件存储CFS Turbo、数据加速器GooseFS和数据万象CI等产品组成,是国内首个实现存储引擎全面自研的云存储解决方案。目前,已经有80%的头部大模型企业选择了腾讯云AIGC云存储解决方案,包括百川智能、智谱、元象等明星大模型企业。


此前,腾讯云已经面向AIGC场景推出了基于星脉网络的大模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等大模型全链路云服务。


10.Timescale收购PopSQL,为PostgreSQL开发人员带来现代的协作式SQL GUI


云数据库公司 Timescale 宣布收购PopSQL,这是一款面向开发人员和数据团队的现代 SQL 编辑器、协作和可视化工具。


通过此次收购,Timescale 客户现在可以完全在浏览器或桌面应用程序中查询他们的数据库。Timescale + PopSQL 使用户可以轻松地在其数据库之上创建可视化仪表板,保留过去查询的历史记录以供重用,与团队中的其他人协作处理查询等等。


PopSQL 使用自动完成、架构探索和版本控制功能使其成为处理数据的简化方式。它可以连接到 PostgreSQL、Timescale 和其他常用数据源,如 Redshift、Snowflake、BigQuery、MySQL、SQL Server 等。成千上万的开发人员和数据分析师已经使用PopSQL来处理他们的数据。


11.Coalesce筹集了5000万美元以扩展数据转换平台

Coalesce.io完成了5000万美元的风险投资融资,该供应商计划将其用于进一步开发其数据转换平台。Industry Ventures 和 Emergence Capital 领投了B 轮融资,使该供应商的总融资额达到 8100 万美元。


Coalesce 总部位于旧金山,是一家初创公司,为 Snowflake Data Cloud 的客户提供数据转换功能。具体来说,供应商的工具使 Snowflake 用户能够清理、建模和记录数据,以确保数据质量并准备数据以供探索和分析。


除了 Coalesce,DBT Labs也密切关注数据转换。此外,Informatica、Matillion 和 Trifacta 等供应商还提供数据转换工具。



数据库



12.选信创厂商全景地图推出,国产替代实力企业星环科技入围

近日,中国领先的产业数字化研究与咨询机构爱分析发布《2023-2024爱分析·信创厂商全景报告》,综合考虑企业需求、关注度等因素,选取其中5个特定市场进行重点分析,通过对各特定市场的需求分析和代表厂商的能力解读,为国产替换选型提供参考。星环科技成功入选其“信创厂商全景地图”大数据平台、湖仓一体、数据库多个板块。


目前,星环科技已经助力金融、政府、能源、制造、交通等行业多个客户打造自主可控的数据底座,替代的对象包括传统关系型数据库Oracle、IBM DB2、Teradata,图数据库Neo4j,搜索引擎ElasticSearch等多家国外主流厂商产品。


13.开源GraphQL数据管理语言初创公司Hasura推出超级图功能,简化复杂API数据集成

流行的开源 GraphQL 数据管理语言商业版本的初创公司Hasura 宣布对该平台进行关键更新,集成了“超级图”(supergraph)技术,使应用程序更容易从多个来源访问数据。


该公司表示,Hasura V3 现已推出测试版,吹捧了一种新的“以领域为中心的超图建模框架”,该框架为应用程序编程接口的可组合性设定了新标准。此外,它还配备了一个新的分布式超级图执行引擎和各种开源数据连接器,以帮助解决数据和 API 集成的一些挑战。


总部位于旧金山的 Hasura 的旗舰产品 Data API Platform 使开发人员能够更轻松地使用 GraphQL,这是一种开源工具,用于构建运行更高效的软件应用程序。GraphQL 的主要目的是使开发人员更容易构建 API,应用程序使用这些 API 从数据库中检索信息。


通常,当应用请求访问数据库中保存的记录时,数据库会确定该信息的传递方式,而不是应用。但这是一个问题,因为它通常会导致技术问题,例如数据库发送的信息比请求的多,或者以应用程序无法读取或处理的格式提供信息。


GraphQL 解决了这个问题,确保应用程序只接收请求的信息,避免不必要的数据传输,从而占用可用带宽。这可以转化为大规模的显著成本节约,并且还有助于提高应用程序性能。


随着 V3 的推出,Hasura 旨在通过其创新的新超级图功能提供更可靠的 API 数据访问。


14.百度向量数据库VectorDB免费测试开放

百度向量数据库VectorDB 1.0全新发布。VectorDB 1.0 的性能卓越,相比同类型开源产品,性能最高可提升 分 10 倍!它支持百亿向量存储规模,并能实现毫秒级的向量检索速度,轻松应对企业数以千万计的文档知识管理需求。


不仅如此VectorDB 1.0 还集成了全面的运维控制和安全防护能力,确保企业数据的安全稳定。同时,它兼容千帆、LangChain 等主流生态系统,为企业提供更加灵活和高效的解决方案


为了加速推动 AI 原生应用的落地,现推出了免费版 VectorDB 1.0 方便开发者打造特色的 AI 原生应用,0 门槛免费创建。


15.面向数据库的操作系统:80岁的PostgreSQL之父宣布推出DBOS Cloud

DBOS 的创建者最近推出了 DBOS Cloud,这是一个为 TypeScript 开发人员量身定制的事务性无服务器应用程序平台。由于所有的状态信息都存储在一个高可用的 DBMS 中,这个新平台可确保事务性无服务器计算,提供可靠的执行以及所谓的“时间穿越”(time travel)功能。


DBOS被称为“世界上第一个云原生操作系统”和“Kubernetes 上的数据库替代品(database alternative to Kubernetes)”,它用 SQL 实现了操作系统服务,运行在一个高性能的分布式、事务性、分区容错的数据库之上。


DBOS Cloud 会自动记录应用程序执行的每一步以及它在数据库中所做的每一次更改。DBOS Cloud 的两个明显特性是可靠的执行和时间穿越:如果 DBOS 程序上运行的代码发生了中断,它会自动从中断点恢复,而无需重新执行任何先前完成的工作。


16.亚信安慧AntDB-T数据库重分布的实现原理

亚信安慧AntDB-T是一款通用企业级、高可用、高性能的原生分布式关系型数据库,具有多种分片方式。在数据库的使用过程中,随着数据的变更和增长,需要重新修改表的分片方式。


AntDB-T数据库支持重分布命令,在内核中有两种实现方式,本文主要针对通过既有的一些SQL命令来实现重分布的内部实现进行介绍。


17.向量数据库企业Pinecone 推出合作伙伴计划,将更多公司带入AI堆栈

Pinecone推出合作伙伴计划,通过提供对其产品内部市场领先的向量数据库的简化访问,使软件提供商成为关键人工智能生态系统的一部分。扩展和简化开发人员在其现有工具中对向量数据库的访问将大大加速 AI 应用程序的成功部署。


Pinecone 向量数据库是 AI 技术堆栈的关键组成部分,允许公司存储、搜索和查找公司数据中最相关和最新的信息,并在每次查询时将该上下文发送到大型语言模型,从而帮助公司解决部署GenAI解决方案的最大挑战之一——幻觉。此工作流称为检索增强生成 (RAG),借助Pinecone,它有助于从搜索或 GenAI 应用程序向最终用户提供相关、准确和快速的响应。Pinecone是市场和技术的领导者,拥有庞大的集成解决方案和云合作伙伴生态系统。


新计划为选定的合作伙伴提供了优势,以向其客户提供具有竞争力的 AI 构建功能。它们包括用于无缝用户体验的简化集成选项、用于提高可见性的使用情况报告,以及用于推动成功采用的销售、营销和技术支持。该计划将与行业领先且快速崛起的公司作为启动合作伙伴启动,包括 Anyscale、Confluent、LangChain、Mistral、Monte Carlo、Nexla、Pulumi、Qwak、Together.ai、Vectorize 和 Unstructured,更多内容即将公布。


18.企业数据库CrateDB宣布在Google Cloud Marketplace上可用

CrateDB 是一个用于时间序列、文档和向量的企业数据库,宣布在 Google Cloud Marketplace 上推出,致力于构建最开放和创新的 AI 生态系统。


这一战略举措使企业能够将 CrateDB 与其 Google Cloud 基础架构无缝集成,使他们能够利用时间序列和 AI 项目中的数据,并以前所未有的方式开发有意义的见解。


CrateDB 在 Google Cloud Marketplace 上的推出代表着企业向前迈出的重要一步,旨在优化运营效率并释放创新的数据驱动机会。CrateDB 专为处理当今数字世界的规模和复杂性而设计,为用户提供了实时查询和分析大量数据的能力。


19.Aerospike 筹集1.09 亿美元,加速数据库开发

销售高度可扩展的实时 NoSQL 数据库管理系统的 Aerospike表示,完成由 Sumeru Equity Partners LP领投的1.09 亿美元投资,这使其总资金达到2.41亿美元。


Aerospike 的闪存优化内存模型可从 GB 扩展到 PB,具有高一致性和低延迟。其核心市场是广告技术、金融服务、电信、零售和医疗保健。该模型以开源社区版和具有企业功能的商业产品提供。


Aerospike 最初基于键值存储架构,但该公司近年来对其进行了扩展,以支持 JavaScript 对象表示法、图形和向量功能。去年,它发布了第一个托管服务,并计划将vector和Langchain支持集成到其云产品中,以满足对人工智能开发日益增长的需求。“向量和图是互补的,展望未来,我们相信有机会将它们结合在一起。”



数据安全



20.Trellix推出全新AI驱动的零信任解决方案,以增强网络安全

网络安全公司 Trellix布推出一款零信任解决方案,提供本地监控、保护和威胁检测。


Trellix 零信任战略解决方案,利用 Trellix 的人工智能驱动的 XDR 平台,使组织能够通过更快地采用零信任框架来建立安全卫生并增强网络弹性。Trellix 表示,ZTS 在单一解决方案中提供最全面的覆盖范围,为组织降低风险、复杂性和成本。


新解决方案中包含的 Trellix 预防、检测、响应和取证端点套件,以及移动安全技术,为组织提供了对所有设备的可见性和控制。借助额外的可见性,安全运营中心可以在攻击之前、期间和之后迅速采取行动。


21.55%企业今年采用GenAI,GenAI 集成安全将大幅增加


根据云安全联盟和谷歌云的一项调查,55% 的组织计划在今年内采用 GenAI 解决方案,这表明 GenAI 集成将大幅增加。


人工智能与网络安全的集成不仅是一个概念,而且对许多人来说是一个实际现实,67%的受访者表示已经专门出于安全目的测试了人工智能。至于利用人工智能的能力,48%的专业人士表示对组织执行利用人工智能安全战略的能力有信心,28%的人感到相当有信心,20%的人非常有信心。


鉴于GenAI在该领域处于起步阶段,这种程度的保证表明,许多专业人士可能对他们的准备工作持乐观态度,或者忽视了AI集成的复杂性。



AI



22.OpenAI发布新AI微调工具,“绝大多数组织将开发定制模型”

在迈向更加个性化的人工智能的重大举措中,OpenAI 宣布对其微调 API 进行重大改进,同时扩展其自定义模型计划。


这些更新将使开发人员能够对 AI 模型微调进行前所未有的控制,同时也为构建针对特定业务需求量身定制的自定义模型提供了新的途径。


自 2023 年 8 月推出以来,GPT-3.5 的微调 API 已经改变了旨在为不同任务改进 AI 模型的组织的游戏规则。


这个过程不仅加深了模型对特定内容的理解,还增强了其现有的知识库,使其更擅长执行有针对性的任务。成功案例数不胜数,数以千计的组织为各种应用程序微调了数十万个模型,从编程语言优化到个性化内容创建。


最新的 API 改进包括基于纪元的检查点创建,最大限度地减少了对重新训练的需求并降低了过度拟合风险。


此外,新的比较 Playground UI 有助于对模型输出进行并行评估,从而利用人类见解增强开发过程。


这些更新,以及从权重和偏差开始的第三方集成,以及全面的验证指标,标志着微调技术的重大飞跃。


OpenAI还扩展其定制模型计划,该计划现在包括辅助微调和开发完全定制训练的模型,特别适合具有标准 AI 模型无法满足的特殊需求的组织。


23.Apache Cassandra数据库企业DataStax收购Langflow,扩展GenAI应用开发组合

DataStax收购Langflow,一个流行的框架提供商,用于构建使用检索增强生成 (RAG) 技术的生成式 AI 应用程序。


收购Langflow将使DataStax能够提供完整的技术堆栈,包括数据管理和开发框架,用于构建使用检索增强生成技术的生成式AI应用程序。


通过此次收购,DataStax的核心数据平台基于Apache Cassandra数据库,正在寻求加强其在AI数据和应用程序开发领域的地位。


Langflow 的平台因其简化 RAG 应用程序开发的能力而引起了 AI 社区的关注,这对于提高生成式 AI 输出的相关性和准确性至关重要。通过将Langflow的技术整合到其产品组合中,DataStax旨在为企业提供一个全面、用户友好的解决方案,用于大规模构建和部署生成式AI应用。


24.英特尔推出最新的人工智能芯片Gaudi 3,三大优势与英伟达竞争升温

英特尔推出了其最新的人工智能芯片Gaudi 3。这家芯片制造商急于生产可以训练和部署大型AI模型的半导体,例如支持OpenAI的ChatGPT的模型。


新的 Gaudi 3 芯片的能效是英伟达前一代产品H100 GPU的两倍多,并且可以比H100 GPU 快一倍半。同时Gaudi 3 还有不同的配置,例如在一块主板上捆绑八个 Gaudi 3 芯片或可以插入现有系统的卡。


英特尔在Meta 的开源 Llama 和阿布扎比支持的 Falcon 等模型上测试了该芯片。Gaudi 3可以帮助训练或部署模型,包括Stable Diffusion或OpenAI的Whisper语音识别模型。



商务合作

扫码关注我们




END




文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论