
点击上方蓝字关注我

行业快讯与友商动态 2024年第26期:
多模数据库能够支持多种数据模型,降低数据库操作的复杂性,近年来受到了业界的广泛关注。星环科技的ArgoDB数据库产品在多模数据库产品基础能力测试中首家通过,展示了其在多模数据处理方面的实力。
浪潮发布了分布式多模数据库KaiwuDB 2.0版本,面向IoT多模架构升级,为数据多样性和复杂化挑战的企业用户提供全新的视角和解决方案。
阿里云飞天产品发布阿里云大数据AI平台的新能力和新产品,涉及人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品。
本周焦点
1.国内首家!星环科技 ArgoDB通过中国信通院多模数据库产品测试
2.2024年全球数据库发展研究报告解读:多模数据库:支持多种数据模型,降低数据库操作的复杂性
3.从基于多数据模型分析负载的Benchmark讨论多模数据库的发展方向
大数据
4.国家数据局提四个方面做好数据工作
5.星环科技×恒生电子,联合打造反洗钱解决方案
6.阿里云飞天大数据AI平台产品全面升级
7.基于Apache Iceberg等开放数据湖表格的湖仓管理系统Amoro 0.7.0 发布
8.HCL软件宣布收购元数据管理软件提供商Zeenea
9.Cloudera通过新功能加强元数据管理
10.Astronomer将DBT Core支持添加到数据编排套件中
11.AtScale借助语义层和生成式AI 在文本转SQL的准确性上设立了新标准
数据库
12.星环科技6款数据库产品获信通院权威认可
13.开源时序数据库GreptimeDB完成数百万美元的新一轮融资
14.浪潮发布分布式多模数据库KaiwuDB 2.0版本,面向IoT多模架构升级
数据安全
15.360智能化数据安全系列产品发布,实现数据可见、可管、可用!
16.Securonix与TD SYNNEX合作推出先进的AI网络安全解决方案
17.CalypsoAI推出可适应的综合GenAI安全技术
AI
18.Gartner警告称到2025年30%的GenAI计划将被放弃
19.微软与Palantir合作提升美国国防与情报的AI能力
20.AI+全面升级数智底座,用友发布三大行业垂类大模型
21.阿里发布轨迹可控的DiT视频生成模型—Tora
22.国内开源社区OpenBMB发布多模态大模型——MiniCPM-V 2.6
23.阿里开源新语音模型,比OpenAI的Whisper更好!

本周焦点

1.国内首家!星环科技 ArgoDB通过中国信通院多模数据库产品测试
日前,在中国信通院组织的首批“可信数据库”多模数据库产品测试中,星环科技分布式分析型数据库ArgoDB首家通过多模数据库产品基础能力测试。测试过程依据标准在基本功能、运维管理、安全性、兼容性、扩展性以及高可用六大能力域的相关要求。测试结果表明,ArgoDB在多模数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《多模数据库技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据与区块链工作组(CCSA TC1 WG6)以及大数据技术标准推进委员会(CCSA TC601),联合超过30家企业专家参与编制的技术标准。其包含基本功能、运维管理、安全性、兼容性、扩展性以及高可用六大能力域共33个测试项,其中分为21个必选项和12个可选项。作为业内首个多模数据库技术标准,可为多模数据库的研发、测试以及选型提供参考。
ArgoDB是星环科技自主研发的分布式分析型数据库,基于多模型统一架构支持关系型,图、键值、时序、时空等多种数据模型,同时提供实时数据处理、存算解耦、混合负载、数据联邦、隐私计算、动态脱敏等技术能力,一站式满足OLAP、多模型融合分析、数据仓库、实时数仓、湖仓集一体等场景的建设需求。
2.2024年全球数据库发展研究报告解读:多模数据库:支持多种数据模型,降低数据库操作的复杂性
本文将深入解读《2024年数据库发展研究报告》,为您揭示数据库技术的最新趋势和行业应用。
2024年,全球数据库市场规模首次突破1000亿美元,达到1010亿美元。中国数据库市场规模为74.1亿美元,占全球市场的7.34%。预计到2028年,中国数据库市场总规模将达到930.29亿元,年复合增长率(CAGR)为12.23%。
全球共有518家数据库企业,产品数量超过715款。中国数据库供应商数量为167家,产品数量达到269款。数据库市场的繁荣,反映了数据作为新型生产要素的重要性。
数据库发展上,云计算与数据库协同发展:云原生数据库通过存算分离架构,实现了存储和计算的独立扩展,提升了数据库的弹性和性能。
图技术洞悉数据关联价值:图数据库通过直观的数据模型和灵活的结构调整能力,处理复杂的关系网络。
湖仓一体提升数据处理性能:湖仓一体技术整合了数据仓库和数据湖的优势,实现了海量异构数据的统一存储和处理。
在数据库方向上,向量数据库:提高了非结构化数据的检索效率,支持人工智能的高速发展。
多模数据库:支持多种数据模型,降低数据库操作的复杂性。
全密态数据库:提供数据全生命周期的加密处理,保障数据安全。
时空数据库:增强了对天量、栅格和点云等时空数据的融合查询和分析能力。
同时,人工智能与数据库双向赋能。AI for DB:人工智能技术优化数据库运维,降低操作门槛,实现数据库的自我管理和运维;DB for AI:数据库技术支撑大语言模型部署,提升检索精度,助力人工智能高效建模。(https://www.sohu.com/a/794232892_121943181)
3.从基于多数据模型分析负载的Benchmark讨论多模数据库的发展方向
文章从性能测试的角度,探讨了多模数据库的发展方向。
文章三个结论:
结论1:基于统一kv/宽表底座的多模型数据库是错误的方向,只有不同模型拥有不同的存储引擎才可以带来最大的综合性能优势
结论2:哪怕是最优秀的存储引擎也只是在Trade-off,没有一种设计可以保证所有情况下的最优,所以需要智能化调优,并在项目选型之初选择最适合业务场景的引擎。
结论3:完全独立的多个不同模型数据库对于联合分析的场景性能较差。(https://blog.csdn.net/weixin_43705457/article/details/135730518)

大数据

4.国家数据局提四个方面做好数据工作
“作为新型生产要素,数据拥有不同于土地、资本等传统要素的新特点,需要通过有为政府和有效市场的更好结合,适应数据特征,着力把握以下四个方面。”国家数据局党组书记、局长刘烈宏近日在业内会议中表示。
刘烈宏表示,一是把握演进性,顺应规律抓好重点。二是把握复杂性,统一思想注重协同。三是把握系统性,统筹兼顾量质并举。四是把握长期性,久久为功持续推进。
刘烈宏称,着力强化“四个注重”,为数据事业发展做出更大贡献:注重推进实践探索,注重加强协同合作,注重强化场景牵引,注重守好安全底线。
5.星环科技×恒生电子,联合打造反洗钱解决方案
近日,星环科技与恒生电子联合发布反洗钱解决方案,系统覆盖金融机构全业务全客户全流程,满足客户尽调、大额可疑交易检测、名单筛查、自评估等各项要求,引入大数据技术,通过数据治理系统化闭环管理以及“AI+规则”提升可疑监测模块有效性,旨在为金融机构解决当前反洗钱数据标准不一、数据孤岛、利用率低等问题,整合多维度数据资源,充分挖掘数据价值。
方案以星环科技大数据与数据库相关产品为支撑,依托星环科技大数据基础平台TDH帮助企业轻松实现GB-PB级多源异构数据的高效存储和统一管理,支持海量数据大规模并行计算;采用创新的多模型技术架构,轻松胜任高阶数据分析需求;支持存算解耦,用户可以根据业务变动按需申请计算和存储资源,实现灵活的横向、纵向扩展。
6.阿里云飞天大数据AI平台产品全面升级
阿里云飞天产品发布阿里云大数据AI平台的新能力和新产品,涉及人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品。
阿里云大数据和AI产品体系中,包含批处理、流处理、实时交互式查询在内的大数据计算引擎服务,AI训练和推理引擎服务,以及上层的大数据和AI开发平台。在此之上,今年阿里云将推出统一的大数据和AI湖仓能力支持,实现整个系统内数据的高效计算和流转。未来,阿里云将继续在大数据和 AI 领域深耕,为用户带来更优质、高效的服务和体验。
阿里云人工智能平台PAI,是一款是面向开发者和企业的机器学习/深度学习工程平台,底层与阿里云基础设施无缝衔接,中间层即 PAI 的产品主体提供了数据标注、模型构建、模型训练、模型部署、推理优化在内的AI工程全链路服务,上层无缝衔接 ModelScope、ModelStudio 等各类 MaaS 平台。人工智能平台PAI在训练服务、推理服务和AIGC场景化实践三方面带来了相应的能力升级。
云原生大数据计算服务 MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,为大模型时代提供大数据AI一体化的数据基础。
E-MapReduce Serverless 为企业提供开源、开放、开箱即用的全托管免运维开源大数据产品。此次 EMR 产品发布了 Serverless Spark 和 Serverless StarRocks 两项新能力。
实时数仓 Hologres 是阿里云自研的一站式实时数仓引擎,支持海量数据写入、实时更新、实时分析、写入即可查,支持标准的SQL协议,支持PB级数据多维分析和即席分析,支持高并发、低延迟的在线数据服务。与 MaxCompute、FLink、DataWorks 无缝集成。与 DLF、OSS 深度融合,提供离在线一体全栈数仓和湖仓一体的解决方案。支持丰富的开发接口,支持对接十余种主流BI。
阿里云Elasticsearch-AI 搜索拥有丰富的 AI 搜索能力,基于效果更优的 RAG 全链路模型,加强数据预处理及检索增强能力,支持不同场景的业务应用。
7.基于Apache Iceberg等开放数据湖表格的湖仓管理系统Amoro 0.7.0 发布
Amoro 0.7.0 第一个孵化器版本正式更新发布!Amoro 是一个构建在 Apache Iceberg 等开放数据湖表格之上的湖仓管理系统,提供了一套可插拔的数据自优化机制和管理服务,旨在为用户带来开箱即用的湖仓使用体验。
重要更新包括:
·支持管理表的 Tag 和 Branch
·支持展示优化任务的详细信息
·支持基于 Spark 的 Optimizer
·支持在一个 Catalog 下管理多种 Format 的表
·支持基于 Promethous 的 metric 采集
8.HCL软件宣布收购元数据管理软件提供商Zeenea
HCLTech的软件业务部门HCL软件宣布有意收购Zeenea,一家总部位于法国巴黎的数据目录和治理解决方案创新公司。通过这次收购,HCL软件将进一步增强其数据与分析业务(Actian)。
HCL软件的Actian数据平台在过去几年中在混合数据管理和集成方面实现了强劲增长。增加元数据管理、数据目录和治理能力将使客户能够更好地利用这一数据平台的功能。
Zeenea提供一个智能数据发现平台,支持从搜索和探索到数据目录、数据谱系、治理、合规性和企业数据市场的元数据管理应用。Zeenea依靠自适应知识图谱,帮助组织实现数据访问的民主化,并生成对其资产及其之间关系的360度视图。(actian.com)
9.Cloudera通过新功能加强元数据管理
Cloudera为其元数据管理解决方案推出两个关键增强功能,提升开放数据湖屋的互操作性,同时应对整个数据生命周期日益增长的安全性和治理需求。
Cloudera提供了一个端到端的开放数据湖屋,采用开放标准,可以在任何生态系统中进行集成和互操作。
最新的更新支持这一现代数据架构的承诺,包括:
·Cloudera的新Iceberg REST Catalog集成现已支持通过第三方引擎无缝访问Apache Iceberg表,让用户能够利用各种工具,同时确保统一的安全性和治理。这简化了数据访问,并保持了跨平台的数据权限和数据来源,减少了成本和数据泄露的风险,通过最小化独立安全层的数量。
·Cloudera的共享数据体验(SDX)目前已进入技术预览阶段,作为一种云原生、容器化的体验,提供端到端统一的数据安全、治理和元数据管理,现在经过增强,具有更好的弹性、规模和性能。它支持跨工具的自助数据访问,通过整合安全功能来帮助降低泄露风险,并支持云和本地数据的单一管理视图。(cloudera.com)
10.Astronomer将DBT Core支持添加到数据编排套件中
Astronomer公布其最新的数据编排版本,其中包括对DBT Labs开源平台的支持,旨在为客户提供改进的数据管道性能和安全性。
Astro是供应商为分析准备数据的套件,它基于 Apache Airflow构建。Apache Airflow 是一种开源数据编排工具,提供1,600 多个与数据库、AI 框架和其他平台的集成,这些平台对于开发AI和分析模型和应用程序以及分析数据至关重要。
通过增加对 DBT Core(供应商数据转换平台的开源版本)的支持,Astronomer 使客户能够同时运行Airflow和DBT,从而比单独运行Airflow 提高数据管道性能。
数据转换是整个编排过程的一部分。Airflow 为整个编排过程提供通用功能,而 DBT 则提供了一组专门的功能,可改进转换阶段。(.techtarget.com)
11.AtScale借助语义层和生成式AI 在文本转SQL的准确性上设立了新标准
数据管理和分析的先锋领导者 AtScale 宣布在自然语言处理(NLP)方面取得了重大突破。通过将 AtScale 的语义层和查询引擎与大型语言模型(LLM)结合,AtScale 在文本转SQL的准确性上设立了新标准,实现了令人印象深刻的92.5%,涵盖了所有问题和模式复杂性的组合。
随着企业生成和存储的数据量不断增加,对快速、准确的数据分析的需求也从未如此之高,已远超依赖人类分析师的传统方法。AtScale 的生成式AI集成将自然语言查询转化为精确的SQL命令,大幅提高了效率和决策速度。
AtScale 解决方案的主要优势:
·增强的准确性:实现92.5%的准确率,将自然语言问题翻译为SQL查询。
·简化查询生成:消除了LLM生成连接或复杂商业逻辑的需要,减少错误,提高效率。
·商业上下文集成:为LLM提供必要的商业元数据,确保结果一致且准确。(datanami.com)

数据库

12.星环科技6款数据库产品获信通院权威认可
近日,在2024可信数据库发展大会上,《中国数据库产业图谱(2024年)》、《数据库发展研究报告(2024年)》、《多模数据库技术要求》、《时空数据库性能要求》、《图数据库性能要求》标准等多项研究成果正式发布。星环科技凭借卓越的技术创新能力和市场影响力,揽获多项数据库领域成果。
《中国数据库产业图谱(2024年)》是由中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)发布的数据库产业全景图,旨在全面客观展现我国数据库产业中的关键领域、环节和代表企业。星环科技6款数据库产品入选,包括分布式事务型数据库、分布式分析型数据库、时序数据库、时空数据库、图数据库、搜索型数据库、多模数据库七大类别,涵盖数据库主流产品、数据库前沿产品、数据库服务、数据库安全、数据库生态社区等领域。其中分布式分析型数据库入选领航者。
13.开源时序数据库GreptimeDB完成数百万美元的新一轮融资
近期,开源时序数据库公司格睿科技完成了数百万美元的新一轮融资。本轮融资将用于研发创新和全球化拓展,致力于定义下一代可观测性数据基础设施。
格睿科技成立于 2022 年 4 月,创立以来,致力于开发分布式、高性能的开源时序数据库,广泛应用于可观测、物联网(IoT)及车联网等多个领域。开源至今已收获超过 4000+ Star,并签约多家国内头部客户,例如国家电网 60 个换流站全部采用 GreptimeDB 企业版。
格睿科技成立至今已发布 GreptimeDB 开源时序数据库及企业版产品,高效的边云协同方案,还推出了全托管的云服务 GreptimeCloud。
GreptimeDB是一款Rust 语言编写的时序数据库,具有分布式,开源,云原生,兼容性强等特点,帮助企业实时读写、处理和分析时序数据的同时,降低长期存储的成本。
14.浪潮发布分布式多模数据库KaiwuDB 2.0版本,面向IoT多模架构升级
KaiwuDB分布式多模数据库2.0是在物联网时代应需而生的架构创新,为正在经历数据多样性和复杂化挑战的企业用户提供了全新的视角和解决方案。
生态兼容方面,KaiwuDB 2.0新增时序数据新语法,更贴近SQL标准,并实现常见SQL语法全面兼容;兼容常见PG生态,生态工具基本可复用,进一步提升系统易用性;
性能优化方面,依托重点技术“就地计算”,KaiwuDB 2.0单节点支持50万测点/秒实时数据写入,批量写入支持千万测点/秒,TSBS基准写入速度达200万记录/秒,数据压缩比最高可达30倍。同步优化跨模数据转换性能,实现时序数据与关系数据无缝关联,支持多种IoT设备模型到存储模型的映射;
系统优化方面,将无中心对等分布式架构优势最大化,实现超高可用性及按需水平扩展;并通过原生AI赋能数据库查询优化和系统自主演进,让系统拥有自适应、自管理、自执行和自监控的能力。同步支持主流机器学习框架,并利用数据库数据对 AI模型进行反向训练、校准,以期让用户的 AI投入更有回报。

数据安全

15.360智能化数据安全系列产品发布,实现数据可见、可管、可用!
360 “北极星守护”数据安全系列产品发布。该系列产品以一款数据安全管理平台和七款探针产品及数据安全整体运营服务,面向数据库流转、API数据流转、数据出入境流转等典型场景,以平台、探针、服务三位一体的数据安全整体解决方案,为政企单位提供数据安全监测与运营一站式服务,实现对数据安全生命周期的全面跟踪保护。
360数据安全管理平台整合了360云端安全服务能力及大网数据泄露监测能力,通过基于互联网侧扫描结果识别发现数据泄露的风险,为客户构建全面的数据安全体系,实现数据安全的统一管理与防护。
此外,数据安全监督检查工具系统、数据库安全网关系统、API安全网关系统、数据静态脱敏系统、数据库加密系统、数据库审计系统、数据库防火墙系统这七款数据安全探针产品将精准地布控在数据安全的每一个角落,以数据识别、风险评估、异常检测、应急响应、合规审计、持续监控及智能优化等关键技术,为数据流动提供360度无死角的保护,全面提升数据安全体系化运营的效率。
16.Securonix与TD SYNNEX合作推出先进的AI网络安全解决方案
Securonix公司,五次入选Gartner魔力象限的网络安全领导者,专注于安全信息和事件管理(SIEM),宣布与全球领先的IT生态系统分销商和解决方案聚合商TD SYNNEX建立新合作伙伴关系,向其广泛的解决方案提供商网络分发Securonix的AI增强SIEM平台。
这一合作显著扩展了Securonix EON的市场覆盖率,该平台将先进的AI能力引入Securonix的领先SIEM平台。这一增强功能强化了平台的各个层面,使组织能够更有效地应对动态的网络安全威胁。
TD SYNNEX帮助最大化技术投资的价值,展示业务成果,并为其多样化的客户基础开启增长机会。与Securonix的合作支持了其在网络安全、云计算、分析和AI领域的高增长机会,并展示了其为合作伙伴生态系统提供市场领先解决方案的承诺。(securonix.com)
17.CalypsoAI推出可适应的综合GenAI安全技术
人工智能安全领域的领军者CalypsoAI宣布推出一系列新功能,使企业能够根据自身独特需求定制其生成式人工智能(GenAI)安全。为了进一步实现其在企业范围内保障GenAI安全的使命,CalypsoAI的最新更新超越了传统安全技术,这些技术在应对不断演变的AI威胁环境时缺乏细致性。
GenAI运动引发了关于如何安全地采用和部署这些技术的有效担忧,传统安全工具在解决这些问题时显得力不从心。根据CalypsoAI和埃弗雷斯特集团的研究,调查显示,55%的受访者指出数据安全和隐私是GenAI采用的主要挑战。
对GenAI安全日益关注的部分原因是,不同行业、部门和公司之间的使用案例差异;GenAI安全解决方案不仅必须有效,还需具备独特的适应性和可定制性。
为应对这些挑战,CalypsoAI推出了一系列先进工具,以确保、审计和监控所有模型、供应商和模式下的内部和外部GenAI使用。这些新工具建立在CalypsoAI之前推出的可定制GenAI扫描器的基础上,使企业能够用自然语言构建自己的基于AI的扫描器。
CalypsoAI推出了以下先进的GenAI安全技术:
·为特定用例和行业设计的即开即用扫描器,包括个人身份信息(PII)和源代码漏洞
·CalypsoAI平台内的动态实时威胁更新,依托一个快速适应新威胁的先进模型,使企业能够实时应对不断演变的风险,包括零日攻击
·与IBM watsonx的新模型合作和集成,将IBM的AI模型与Calypso的先进威胁检测相结合,为现代网络威胁提供全面防御。
·新的Calypso AI安全社区,允许用户与他人分享成功的定制扫描器,增强知识共享,提高GenAI安全最佳实践的可见性。(dbta.com)

AI

18.Gartner警告称到2025年30%的GenAI计划将被放弃
根据领先的研究和咨询公司之一Gartner的数据,早期押注人工智能潜力的组织可能会发现其期望没有得到满足。目前更多的企业正在努力证明在提高生产力方面的GenAI投资是合理的,并正在寻求部署GenAI来改变其业务并创造新的商机。
尽管GenAI具有新颖性和兴奋性,但许多组织仍在努力解决如何有效利用其潜力的问题。Gartner 报告预测,到 2025 年底,目前正在测试中的至少30%的GenAI项目将在概念验证后被放弃。成本上升、数据质量差、业务价值不明确和风险控制不足是GenAI项目失败的最常见原因。(今日头条)
19.微软与Palantir合作提升美国国防与情报的AI能力
Palantir Technologies和微软公司宣布在合作关系上取得重大进展,旨在为美国国防与情报界提供最复杂和最安全的云、AI和分析能力。这是首个整合技术方案,将使关键国家安全任务能够通过Azure OpenAI服务在Palantir的AI平台(AIP)中,利用微软的顶尖大语言模型(LLMs)。
Palantir和微软在安全和认证环境中有着悠久的合作历史,为美国国防和情报的关键任务提供领先技术。借助这项合作,Palantir将其产品套件 — Foundry、Gotham、Apollo和AIP — 部署在微软的Azure政府云及Azure政府机密(国防部影响级别6)和绝密云中。Palantir还将成为Azure OpenAI服务在微软的机密和绝密环境中的早期采用者。
这一微软Azure云计算与强大语言模型(GPT-4及其他)与Palantir Foundry的数据集成和本体能力及AIP的用例构建能力的整合解决方案,将使操作人员能够安全、负责任地在国防和情报垂直领域构建以AI驱动的操作工作负载 — 从后勤、合同到优先级和行动计划等等。服务的可用性需经过相关政府机构的授权和认证。(winbuzzer.com)
20.AI+全面升级数智底座,用友发布三大行业垂类大模型
在2024全球商业创新大会上,发布了企业服务大模型2.0。YonGPT 2.0是深懂企业服务的垂类大模型,它将“繁杂企业应用需求”与“通用大模型”的鸿沟连接起来,成为企业AI应用新引擎。
在行业数智化转型浪潮中,为满足特定领域深度应用的需求,行业垂类大模型的应用成为大势所趋。通过深度融合行业知识与AI技术,企业可以实现更高效、更精准的决策支持与业务优化。
在会上,用友联合深圳市远东数智采技术服务有限公司、江苏亨通数字智能科技有限公司、中国交通信息科技集团有限公司分别面向公共资源交易行业、工业装备行业、交通建设行业,发布三大行业垂类大模型,为行业高质量发展插上AI翅膀!
21.阿里发布轨迹可控的DiT视频生成模型—Tora
当前已有一些优秀的方法如 DragNUWA 和 MotionCtrl 已经实现了轨迹可控的视频生成,但这些方法受限于传统 U-Net 去噪模型,大多只能生成 16 帧长度、固定低分辨率的视频,难以应对长距离轨迹。此外,如果轨迹过于不规则或存在偏移过大等情况,这些方法十分容易出现运动模糊、外观失真和不自然的运动如漂移闪现等。
为了解决这些问题,阿里云提出了一种基于 DiT 架构的轨迹可控视频生成模型 Tora。Tora能够根据任意数量的物体轨迹,图像和文本条件生成不同分辨率和时长的视频,在720p分辨率下能够生成长达204 帧的稳定运动视频。值得注意的是,Tora继承了DiT的scaling特性,生成的运动模式更流畅,更符合物理世界。
22.国内开源社区OpenBMB发布多模态大模型——MiniCPM-V 2.6
国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V 2.6。
据悉,MiniCPM-V 2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet。
值得一提的是,MiniCPM-V 2.6显著减少了模型的内存占用并提高了推理效率,首次支持iPad等端侧设备进行实时视频理解的模型。
MiniCPM-V 2.6是基于SigLip-400M和阿里的Qwen2-7B模型开发而成,相比V 2.5 性能进行了大幅度更新,并引入了多图像和视频理解的特色功能。
23.阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。
Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。
例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一段吵闹的声音,分析有哪些声音组成等。
目前,Qwen2-Audio支持中文、粤语、法语、英语、日语等主流语言和方言,这对于开发翻译、情感分析等应用非常方便。


扫码关注我们
扫码关注我们
END




