点击蓝字
关注我

本周焦点(行业快讯与友商动态 2024年第36期)
1、星环科技荣获上海市科学技术奖科技进步二等奖
2、英伟达CES 2025发布RTX 50系列显卡及AI超级计算机
3、微软发布Phi-4,小参数模型性能超越GPT-4o
4、阿里云通义万相2.1视频生成模型重磅升级,成功登顶VBench
5、昆仑万维「天工大模型4.0」o1版和4o版正式上线
6、阿里云推出Fluss湖流一体架构
7、华为TaurusDB发布新特性:字段压缩
8、金仓焕新发布云数据库一体机KXData-M
今日 · 看点
星环科技荣获上海市科学技术奖科技进步二等奖
根据《上海市科学技术奖励规定》(沪府令8号),通过市科学技术奖评审委员会评审,市科学技术奖励委员会审定,经上海市人民政府批准,2023年度上海市科学技术奖授奖214项(人)。星环科技与国网上海电力等单位联合申报的“服务城市数字治理的电力数据安全管控关键技术与应用”荣获2023年度上海市科技进步二等奖。

上海市科学技术奖由上海市人民政府设立,重点奖励科学发现和技术发明原始性创新、促进经济发展方式转变和培育战略性产业、促进城市安全、健康生态发展和推进区县创新能力和经济发展的重大科技成果。
本届上海市科学技术奖的奖项分为科学技术普及奖上海市科技进步奖、上海市技术发明奖、上海市自然科学奖、上海市国际科技合作奖、上海市青年科技杰出贡献奖、上海市科技功臣奖七个类型 。星环科技创始人兼CEO孙元浩曾获2020年上海市科学技术奖-青年科技杰出贡献奖。2022年星环科技和上海交通大学等单位联合申报的“面向多云协同的智能数据平台的关键技术与应用”荣获2022年度上海市技术发明一等奖。
“服务城市数字治理的电力数据安全管控关键技术与应用”与星环科技大数据平台TDH、大数据开发工具TDS等多个产品和数据安全解决方案结合,解决了数据全生命周期的数据安全和合规性等问题。
星环科技为数字政府提供一体化公共数据平台,贯彻智慧城市、数字政府、数据要素市场化以及国家一体化政务大数据体系建设要求,以云、数、智等核心信创自主的基础软件产品,打造契合政务和公共数据集成、存储、治理、分析挖掘、共享开放和流通的一体化平台。以解耦和开放模式拥抱各生态厂商的耦合与集成,对内可作为支撑政府数据共享和协同的政务数字底座;对外结合区块链、物联网、数字孪生、大模型等技术能力,形成可支撑政务服务、城市运行、经济发展、城市民生的城市级数字底座。

大模型资讯

英伟达CES 2025发布RTX 50系列显卡及AI超级计算机
在CES 2025上,英伟达CEO黄仁勋发布了基于Blackwell架构的新一代RTX 50系列显卡,包括RTX 5090和RTX 5080。
RTX 5090 GPU是迄今为止最快的GeForce RTX GPU,配备了920亿个晶体管,每秒可实现超过3352万亿次AI运算,性能较上一代RTX 4090提升了近两倍。RTX 5080设计目标是性能达到RTX 4080的两倍,配备16GB的GDDR7显存,内存带宽为960GB/秒,以及10752个CUDA核心。
英伟达还推出了DLSS 4技术,这是新一代深度学习超级采样技术,首次推出多帧生成功能,通过使用AI为每个渲染帧生成多达3帧来提高帧速率。DLSS 4将在发布当天支持超过75款游戏和应用程序,并可在GeForce RTX 50系列GPU上使用。
此外,英伟达还宣布推出世界基础模型平台——「英伟达宇宙」(NVIDIA Cosmos),专注于理解和模拟物理世界。该平台主要聚焦于物理动态,包括自然运动、人类行为和物体操作等场景,致力于教导AI理解物理世界的运作方式。
黄仁勋还展示了Project Digits,这是一款搭载英伟达新型GB10 Grace Blackwell超级芯片的AI超级计算机,专为AI研究人员、数据科学家和学生设计。可提供高达petaflop级别的计算性能。Project Digits将于今年5月通过英伟达的顶级合作伙伴推向市场,定价3000美元。
微软发布Phi-4,小参数模型性能超越GPT-4o
微软研究院近日发布了Phi-4,这是Phi系列模型的第五代,以其小参数和高性能著称。Phi-4仅有140亿参数,但在多个基准测试中表现出色,超过了GPT-4o以及其他知名模型,如Qwen 2.5-14B和Llama-3.3-70B。
在GPQA研究生水平和MATH数学基准测试中,Phi-4分别达到了56.1和80.4的高分,超过了GPT-4o。在美国数学竞赛AMC的测试中,Phi-4更是达到了91.8分,超过了GeminiPro 1.5、GPT-4o、Claude 3.5Sonnet、Qwen 2.5等知名模型,整体性能可与4050亿参数的Llama-3.1相媲美。
Phi-4的高性能得益于其使用高质量合成训练数据和创新训练方法。它采用了种子策划、多Agent提示、自我修订工作流、重写和增强以及指令反转等多种合成方法,有效解决了传统无监督数据集的缺点。此外,Phi-4还通过改变任务描述的方式,增加了模型处理不同类型问题的能力,进一步增强了其灵活性和适应性。
在训练方法上,Phi-4增加了rope位置编码的基础频率至25万次,并相应地降低了最大学习率,以更好地适应更长的文本序列。这种做法有效提升了模型对于复杂结构化信息的理解力。Phi-4还特别注重了不同类型数据之间的平衡,避免某类数据过多导致其他方面性能下降的情况发生。
在Phi-4的后训练过程中,研究团队采用了基于人工标注的SFT数据和自动构建的DPO对进行强化训练。通过结合这两种方式,Phi-4不仅学会了如何产生更符合预期的回答,还能够在不同情境下灵活调整语气和风格,从而提供更加个性化的交互体验。
阿里云通义万相2.1视频生成模型重磅升级,成功登顶VBench
近日,阿里云通义万相迎来了重磅升级,推出了万相2.1视频生成模型。该模型在大幅度复杂运动、物理规律遵循、艺术表现等方面实现了全面提升。
根据权威评测榜单VBench的信息,新版通义万相登上榜首位置,超越了混元、海螺AI、Gen3、Pika等国内外视频生成模型。
在具体项目中,通义万相在运动幅度、多对象生成、空间关系等关键能力上获得了最高分,并以总分84.7%的成绩斩获第一。官方介绍称,通义万相团队采用了自研高效的VAE和DiT架构,有效增强了时空上下文关系建模能力,解决了精准理解和模拟物理世界的两大难题。
此外,通义万相在文字视频生成方面实现了突破,成为首个支持中文文字生成能力且同时支持中英文文字特效生成的视频生成模型。这一升级不仅提升了模型的性能,也为用户提供了更丰富的创作工具和更广泛的应用场景。
昆仑万维「天工大模型4.0」o1版和4o版正式上线
近日,昆仑万维宣布旗下「天工大模型4.0」o1版和4o版同步上线,并全量登陆天工网页和App,用户均可免费使用。这两款模型经过全方位的技术栈升级和模型优化,具备强大的逻辑推理和多模态交互能力。
「天工大模型4.0」o1版是国内第一款中文逻辑推理能力的o1模型,不仅包含上线即开源的模型,还有两款性能更强的专用版本。它能够熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。
「天工大模型4.0」4o版是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具,为用户带来温暖贴心、流畅实时的对话体验。
这两款模型的上线,标志着昆仑万维在AI技术领域的进一步发展,为用户提供了更强大的工具和更丰富的应用体验。用户现在可以通过昆仑万维的天工网页和App,免费体验这两款先进的AI模型。

大数据资讯

阿里云推出Fluss湖流一体架构
在大数据处理领域,传统的Lambda架构因包含离线和实时两条链路而逐渐被数据湖统一存储架构取代,但后者在数据新鲜度上存在局限,无法满足秒级延迟需求的场景,因此又需引入流存储,导致架构重新变得复杂,面临诸多挑战,如架构复杂、运维监控繁琐、资源浪费,以及数据一致性、治理和冗余问题。
为解决这些问题,业界出现了湖流一体的趋势,即流和湖互为一体、互为补充。Fluss作为面向实时分析设计的流存储,采用湖流一体架构,能更好地融入Lakehouse架构。
其核心特性包括实时流读流写、列式裁剪等。Fluss的server集群提供毫秒级的端到端延迟,其Compaction Service能将数据compact成标准湖格式,如Paimon/Iceberg,供外部查询引擎分析。同时,Fluss与Paimon中的数据分布严格对齐,避免了Shuffle开销和数据不一致问题。在流读场景下,Fluss可先读湖格式的历史数据再读实时数据,实现高效数据回追;在批读场景下,计算引擎可将Fluss和湖存储中的数据union读,达到秒级新鲜度分析。Fluss还为Flink用户提供了统一API,简化了数据访问。
引入Fluss构建湖流一体架构带来诸多收益,如数据湖时效提升至秒级,数仓分层每层表数据新鲜度一致,changelog生成更高效,且解决了Paimon部分更新不支持多writer的问题。未来,Fluss社区计划拓展Union Read生态,支持更多查询引擎;丰富湖生态,兼容更多湖格式;以及实现Arrow到Parquet的高效转换,降低成本。
华为TaurusDB发布新特性:字段压缩
数据库压缩技术可减少存储空间、降低成本,但社区MySQL InnoDB的压缩功能对热数据影响较大,且压缩机制不够灵活。TaurusDB的字段级压缩特性针对VARCHAR和LOB字段,提供ZLIB和ZSTD两种算法,用户可根据需求选择,对不频繁访问的大字段进行压缩。该特性还支持自动压缩,对满足条件的列自动添加压缩属性。
在实现原理上,TaurusDB在存储层面根据情况采用压缩或非压缩格式。对于未使用压缩特性的列,保持原有格式;已使用压缩特性的列,则将数据值改为包含压缩头、未压缩前长度和压缩数据的格式,或包含压缩头和未压缩数据的格式。写入时,若字段存在压缩属性,则调用压缩接口写入Page;读取时,若字段存在压缩属性,则调用解压缩接口。压缩/解压缩动作发生在存储引擎层,只针对具压缩属性的列。
使用方面,TaurusDB提供了显式压缩、自动压缩和关闭压缩三种方式,通过相关参数进行设置。用户可通过展示表结构信息、系统视图查询和查询status信息等方式观察压缩效果。对比实验显示,开启字段压缩后,数据大小比值可达1.8及以上,系统性能损失通常在10%以内,实现了经济效益与系统效率的平衡,具有较好的实际应用价值。
金仓焕新发布云数据库一体机KXData-M
新一代KXData-M实现全方位升级,包括:升级金仓数据库私有云平台V2.0、升级金仓数据库管理系统V9、升级金仓超融合平台V2.0、全面支持海光4代芯片。主要能力提升包括:全面兼容VMware、HA高可用2.0、计算能力大幅增强、3节点混闪架构突破百万IOPS。
数据库新特性包括:Oracle/MySQL/SQLServer兼容能力持续增强、客户端编程接口及框架全面升级、提供Roaringbitmap扩展插件,破解内存难题、新增SQL调优建议器与增强KWE/KSH报告、ROWNUM逻辑优化助力高效查询、全局执行计划缓存与分区剪枝双管齐下、强化三权分立,优化资源利用与数据保护。
新一代KXData-M采用更快的引擎,搭载国内首创数据库与一体机深度融合加速引擎:赤兔引擎V1.0,让数据库跑得更快、更久、更稳。具备更强调优能力,在SQL自调优整体能力方面全面增强,自调优后性能提升超过9倍。通过查询优化增强、并行增强、分区优化、锁优化提升整体性能。
此外,新一代KXData-M具备智能运维功能,通过AI分析实现智能预警,精准预测数据库业务可靠性、业务卡慢、硬件亚健康等潜在风险。通过智能调度实现业务保障,包括主动性故障迁移、资源动态调整、预防故障发生、保障业务连续性。同时提供数据库全生命周期维护。
TDengine 3.3.5.0 正式发布:从 taosX 优化到查询增强
近日,TDengine 3.3.5.0 版本正式发布,带来了多项重磅更新与优化,从功能拓展到性能提升,再到用户体验进行了全面改进。本次更新围绕用户核心需求展开,涵盖了开发工具、数据管理、安全性、可视化等多个层面,为各行业的时序数据应用提供了更高效、可靠的支持。本次更新的亮点功能包括:
· MQTT 稳定性和性能提升。大幅提升了数据接入的稳定性和高并发场景下的性能表现,为物联网应用提供更可靠的支持。
· taosX 增量备份与恢复。支持更加高效的增量备份与恢复功能,确保数据安全的同时提升备份效率。
· JDBC WebSocket 连接支持 STMT2 接口。增强了 JDBC WebSocket 的功能兼容性,进一步提升了数据写入速度。
· Rust 连接器支持 STMT2 接口。为 Rust 开发者提供更强大的功能支持,进一步提升了数据写入速度。
· taos-CLI 错误提示增加错误码。通过在错误提示中引入错误码,帮助用户更快速定位和解决问题。
· Python 连接器对接 SuperSet。实现对 SuperSet 的集成,为数据可视化和分析提供了更多可能。
· Explorer 支持配置 Grafana Dashboard。通过灵活配置 Grafana Dashboard,让数据展示更加直观和高效。
· taosX-agent 支持配置内存缓存队列长度。新增对内存缓存队列长度的配置支持,进一步提升数据处理能力。

国外资讯

Amazon Ads 通过新的 SQL 生成器将生成式 AI 引入亚马逊营销云
Amazon Ads宣布推出适用于 Amazon Marketing Cloud (AMC) 的 SQL 生成器,这是一项新的生成式 AI 功能,可帮助广告商更快、更轻松地从其 AMC 信号中获取洞察。这项新的 AMC 功能提供了一个自然语言界面,广告商可以通过该界面为其目标受众用例生成 SQL 查询 - 无需手动创建代码,并将查询开发时间从数小时缩短至数分钟。然后,广告商在 AMC 中运行查询以创建新受众,并在 Amazon DSP 和广告控制台中激活受众。
要使用 SQL 生成器,广告商只需用自己的语言描述他们希望从 AMC 获得的受众输出。生成器将返回相关查询以及创建查询所用的步骤。然后可以使用这些查询来构建自定义受众,这些受众可以在整个营销渠道中为亚马逊广告活动激活,通过流媒体电视、音频和数字频道接触客户。
例如,广告商可以说:“创建一个受众群体,该群体由浏览过我们的产品页面并看过我的 STV 广告但在过去 30 天内未购买过产品的客户组成。”这种生成式 AI 功能使用高级算法创建 SQL 查询来构建受众群体,可用于跨各种渠道重新定位广告系列,从流媒体电视的上层漏斗意识到赞助产品广告的下层漏斗转化策略。
Amazon Ads 广告衡量副总裁 Paula Despins 表示:“借助 SQL 生成器,我们利用生成式 AI 的强大功能,帮助广告商更快地从其数据以及我们的购物和流媒体信号中释放价值,从而执行真正的全渠道广告策略。这种功能不仅提高了生产力,还帮助广告商探索了新颖的使用案例和受众群体,帮助他们发展品牌并优化其在流媒体电视、音频和数字渠道上的媒体支出。”
Google Cloud 推出面向 Agentic AI 时代的全新零售解决方案
如今,零售商面临着成本上升、供应链中断、定价压力和员工流动率高等复杂局面。与此同时,消费者对个性化、全渠道购物体验的期望不断提高。Google Cloud 正在通过一系列旨在推动业务增长并帮助零售商为代理式 AI 时代做好准备的全新 AI 解决方案帮助零售商应对这些挑战。
AI 代理正在改变我们的工作方式,它超越了预测能力,能够自主执行任务。Google Cloud 最近推出了Google Agentspace,这是一个一站式服务,它将 AI 代理、Gemini 的高级推理、Google 质量搜索和企业数据整合在一起,以释放企业专业知识并提高员工的工作效率。这款功能强大的多模式解决方案现已面向零售商推出,它可以在整个零售环境中显示最相关的数据 - 集成文本、图像、视频和音频,以提供直观的用户体验。例如,商店员工在寻找最新产品优势的信息时,现在无需搜索多个 SharePoint 目录页面,现在可以询问“最新功能是什么?”并立即找到详细信息以帮助客户。
Google Cloud 的零售产品组合进一步提供了一系列解决方案,从 Gemini for Workspace 等集成助手到 Vertex AI Agent Builder 等平台,帮助零售商从 AI 代理中获益。借助面向企业的 NotebookLM(现在也可供零售商使用),员工可以通过新的方式与企业数据互动,从而提高工作效率。
Anthropic 或正与 Lightspeed 洽谈新一轮20亿美金融资
近日, Anthropic 正在洽谈由 Lightspeed Venture Partners 领投的 20 亿美金新一轮融资, 估值将达到 600 亿美金。本轮融资完成后, Anthropic 的总融资额将达到 157 亿美金, 成为美国第五大最有价值的初创公司, 仅次于 SpaceX, OpenAI, Stripe 和 Databricks。此前, Anthropic 在 2024 年 11 月获得了 Amazon 的 40 亿美金投资, 并同意将 Amazon Web Services 作为其主要 AI 模型训练合作伙伴, 并帮助优化 Amazon 的 AI 加速器芯片。
Anthropic 是一家专注于人工智能技术开发的公司, 其技术需要大量的计算资源。随着 AI 行业的快速发展, Anthropic 与其他 AI 公司一样, 需要筹集巨额资金来支持其技术的开发和扩展。此前, OpenAI 和 Elon Musk 的 xAI 也分别筹集了 66 亿美金和 60 亿美金。
Oracle 发布新一代 Exadata 数据库优化计算平台
Oracle 公司近日推出了 Exadata X11M,这是其数据库优化计算平台的最新版本,与之前的 X10M 相比,性能得到了明显提升。新版本的 X11M 在 AI 模型训练中的向量搜索速度提升了 55%,分析扫描的处理能力提高了 2.2 倍,事务处理速度加快了 25%。X11M 采用了 AMD 的 96 核 EPYC 处理器和远程直接内存访问(RDMA)技术,与 X10M 相比,数据传输效率更高,访问时间缩短了 50%。该平台支持持久化向量索引搜索,能够以更高的可用性进行大规模数据查询,并引入了用于 SQL 查询的向量距离运算符,以衡量向量的相似性。
Oracle 的专有软件,包括 Smart Scan 和 RDMA 缓存,加速了数据密集型操作和分析,查询处理速度最高可提升 25%。X11M 在设计上支持多云灵活性,适用于本地、云端和托管部署,并与 AWS、Google Cloud 和 Azure 等主要云服务集成。此次发布彰显了 Oracle 致力于将 Exadata 打造成适用于多种部署场景的通用高性能数据库管理平台的决心。

行业资讯

【金融】江苏银行运用大语言模型推动风控能力再升级
近日,江苏银行以科技创新为引擎,运用“智慧小苏”大语言模型,赋能风控领域的数智化转型。江苏银行剖析了数百个风控模型的底层逻辑,提炼出超4000条适用规则,生成约800项常用组件。这些组件单元支持通过特征标签进行查询,并基于规则进行单产品回溯和多产品对比,提高风险管控能力。组件化摒弃了一个场景一组规则的作坊模式,也规范了风控模型的开发和维护流程。依托江苏银行自主研发的“智慧小苏”大语言模型服务平台,风控模型组件化管理充分发挥大模型在代码生成、文本字段提取、语义理解与泛化能力等方面的优势,配合自动化脚本,从工程应用层面聚焦组件化任务。规则组件化工作分为数据收集清洗、组件智能生成与人工审核三大阶段,通过大模型赋能实现组件的高效生成与精准合并,组件准确率超90%。
【政府】七大试点城市联合发起共建数据标注产业可信数据空间倡议
近日,在国家数据局数字科技和基础设施建设司指导下的“第二次数据标注产业供需对接会”上,成都、沈阳、合肥、长沙、海口、保定、大同7个数据标注基地和中国联通联合发起共建数据标注产业可信数据空间倡议。
本次数据标注可信数据空间联合倡议借鉴并发挥了中国联通 2024 年杭州首个公共数据授权运营试点经验,以 “数据加工工厂 + 数据融通市场” 为核心架构,将运营商网络优势与大数据存算、区块链可信凭证、隐私计算及大模型智能分析等前沿技术深度融合,并从网络支撑、数据存储计算、信任保障、隐私保护及智能标注等方面全方位创新,打造出集可信管控、资源互联、联合标注、高质量数据集流通、价值共创于一体的数据标注产业空间,助力地方政府数字化管理与服务,促进数据标注产业及数字经济健康快速发展。

国内政策资讯

国家发展改革委、国家数据局、财政部、人力资源社会保障部联合印发《关于促进数据标注产业高质量发展的实施意见》
国家发展改革委、国家数据局、财政部、人力资源社会保障部联合印发《关于促进数据标注产业高质量发展的实施意见》。
《实施意见》提出到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。
《实施意见》包括总体要求、主要任务、保障措施三个部分。总体要求包括指导思想、发展原则和发展目标。主要任务围绕深化需求牵引、增强创新驱动、繁荣产业生态、优化产业支撑四个方面提出相关政策举措。保障措施重点是建立健全工作机制、加强部门协同、强化政策实施与监督等。
下一步,国家发展改革委、国家数据局、财政部、人力资源社会保障部将强化数据标注产业顶层规划,协调解决产业发展过程中存在的重大问题。加强政策解读和案例征集等宣传推广,营造数据标注产业发展的良好氛围。
全国统一大市场建设指引发布!培育全国一体化技术和数据市场
近日,国家发展改革委官网正式公布了《全国统一大市场建设指引(试行)》(以下简称《指引》),提出要打造统一的要素和资源市场,其中包括培育全国一体化技术和数据市场。
《指引》提出要打造统一的要素和资源市场,包括构建城乡统一的建设用地市场、健全统一的劳动力市场、加快发展统一的资本市场、培育全国一体化技术和数据市场、建设全国统一的能源市场体系、培育发展全国统一的资源环境市场6项内容。在培育全国一体化技术和数据市场中,《指引》提出有关部门要大力推进全国统一、互联互通的技术交易市场建设,加强跨区域交易信息联合发布,完善技术与资本对接平台。有关部门要加快完善统一的数据资源登记规则,制定全国统一的数据交易、安全等标准体系,促进数据要素合规高效流通交易,建立健全数据要素收益分配制度。


扫码关注我们
扫码关注我们
END




