暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

月之暗面发布Kimi新模型,对标OpenAI o1;DeepMind开源AlphaFold 3,推进科学界蛋白质研究

193


点击蓝字

关注我


NEWS

本周焦点(行业快讯与友商动态 2024年第33期

1、星环科技Sophon LLMOps荣获江苏省信息技术应用学会科技创新奖二等奖

2、月之暗面发布Kimi新模型k0-math,对标OpenAI o1

3、DeepMind开源AlphaFold 3,推进科学界蛋白质研究

4、阿里国际推出全球首个B2B AI搜索引擎Accio,简化全球贸易流程

5、通义推出「代码模式」,无编程知识也能创造应用

6、阿里大数据开发治理平台 DataWorks基于StarRocks,打造标准湖仓新范式

7、高性能低侵入,金仓KFS助力老系统焕新生

8、腾讯云数据资产管理能力获IDC认可,WeData获七项满分

9、IDC发布RAG与向量数据库市场前景预测

10、DolphinDB为FICC固收业务提供估值定价、曲线拟合、风险管理等多种函数


今日 · 看点


星环科技Sophon LLMOps荣获江苏省信息技术应用学会科技创新奖二等奖


近日,星环科技大模型运营平台Sophon LLMOps荣获2024年度江苏省信息技术应用学会科学技术奖二等奖。

星环大模型运营平台(Transwarp Sophon LLMOps)是星环科技推出的企业级大模型全生命周期运营管理平台,旨在赋能企业用户能敏捷、高效、有闭环地将大模型落地到生产和业务中去。具备一站式AI开发、支持丰富的应用开发方式、支撑构建高质量知识库、灵活开放的平台使用、全方位的安全防护等优势。


星环大模型运营平台Sophon LLMOps作为一款企业级大模型全生命周期运营管理平台,涵盖了大模型深度学习任务中从数据准备、模型训练、推理部署到监控优化的整个流程,能够帮助数据科学家解决优化训练推理过程中遇到的复杂工程性问题,使得数据科学家能够将注意力集中在训练数据准备、建模微调以及提升业务效果本身,从而更加高效地完成端到端的LLM机器学习任务。同时,该平台还融合了星环自研的向量/文本/图数据库以及分布式文件系统、数据处理和数据中台以及智能分析工具,可以统一管理、分析和应用智能分析前、中、后的多来源、多模态的数据。这有助于用户解决数据的采集整合、处理清洗、标注增强、提示生成、提示评估、业务效果对齐等问题,从而缩短业务落地观察周期,加速业务提升效果。


星环科技Sophon LLMOps此前入选IDC2024年第二季度《中国生成式AI生态图谱》模型构建和编排推荐供应商、IDC“政务大模型厂商图谱”、IDC数据智能核心技术趋势图,亮相2023世界计算大会并入围专题展优秀成果。


此次荣获江苏省信息技术应用学会科技创新奖二等奖,不仅是对星环科技Sophon LLMOps技术实力的认可,也是对其在推动大模型技术发展和应用方面所做贡献的肯定。星环科技将继续致力于为客户提供最先进、最效率、最便捷的AI解决方案,推动人工智能技术的发展和应用,为构建智能化的未来贡献力量。

大模型资讯

月之暗面发布Kimi新模型k0-math,对标OpenAI o1


月之暗面发布了新一代数学推理模型k0-math,旨在对标OpenAI的o1系列。


基准测试显示,k0-math的数学能力可与全球领先的OpenAI o1系列模型相媲美。在中考、高考、考研以及MATH等4个数学基准测试中,k0-math初代模型的成绩超过了o1-mini和o1-preview模型。在难度更大的OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了 o1-mini 最高成绩的90%和83%。


这是 Kimi 推出的首款推理能力强化模型,k0-math 同样采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力,可以帮助用户完成更具挑战性的数学任务 。


k0-math没有前置设计模板,而是希望AI在学习过程中自己衍生出思考方式。尽管k0-math在简单问题上仍可能会出现过度思考的情况,但其深度思考能力是其一大特点。


杨植麟透露,k0-math模型和更强大的Kimi探索版将在未来几周内分批上线Kimi网页版和Kimi智能助手APP,帮助用户解决更具挑战性的数学和搜索调研类任务。这标志着AI产品在深度推理能力上的重要发展。

DeepMind开源AlphaFold 3,推进科学界蛋白质研究


近日,DeepMind宣布科学家们可以下载AlphaFold 3的软件代码,用于非商业目的,目前仅限于具有学术背景的科学家根据要求获得训练权重。


AlphaFold 3 的开源发布具有重大意义。与只能预测蛋白质结构的前代产品相比,第三代系统实现了质的飞跃。它不仅能够模拟蛋白质、DNA、RNA 和小分子之间的复杂相互作用,更深入揭示了生命的基本过程。


这款工具能够进行蛋白质的协同建模,预测蛋白质与DNA相互作用时的结构,并评估潜在药物的性能。开源版本的发布,标志着科学界在蛋白质研究领域的一大进步。


传统研究方法往往需要耗费数月的实验室工作和数百万研究经费,且成功与否难以预料。而现在,研究人员可以通过 AI 技术在几小时内获得可靠的预测结果,大大加快了科研进度。


最初,AlphaFold 3通过网页服务器提供服务时,由于对预测数量和类型的限制,以及未公开代码和模型权重,受到了科学界的批评。DeepMind对此作出回应,承诺在半年内发布开源版本。如今他已兑现了他的承诺。AlphaFold 3的开源,将极大地促进全球科学家在生物医学研究、药物开发等领域的工作。


阿里国际推出全球首个B2B AI搜索引擎Accio,简化全球贸易流程


在欧洲科技峰会Web Summit上,阿里国际宣布推出全球首个B2B AI搜索引擎——Accio,正式进军AI搜索领域。Accio提供了一个对话形式的搜索体验,能够理解并拆解用户需求,精准推荐供应商和商品。


Accio 包含“AI 驱动的搜索”“AI 重构的商品百科页面”“端到端的电商平台”三大模块。其产品突破了传统电商的框架,主体为一个对话框,形态上与 OpenAI 的 SearchGPT、硅谷明星产品 Perplexit 等 AI 原生搜索更像。


用户可用“大白话”来询问 AI、提出需求,Accio 会通过多轮对话,主动去梳理、理解用户真正想要什么,并通过专业的 B2B 行业知识拆解需求、调研市场、给出建议、从而更精准地筛选供应商、推荐商品,像一位真正专业的代理商一样,提供一步到位的智能采购服务。


Accio的目标是简化B2B贸易流程,降低全球贸易门槛。测试结果表明,使用Accio后,用户从搜索到采购的转化率提升了20%到30%。Accio不仅整合了阿里国际站的供给,还链接了全球独立站、第三方电商网站和线下工厂的供给,覆盖了亿级商品,极大地丰富了平台的商品多样性。


阿里国际站总裁张阔表示,Accio的上线版本仅展示了公司对AI时代B2B生意形态想象的10%,未来将不断迭代升级,以满足用户的需求并推动B2B贸易的数字化转型。


通义推出「代码模式」,无编程知识也能创造应用



通义最近推出了一项创新功能——「代码模式」,这一功能使得没有编程背景的用户也能够轻松创建各种应用程序。用户可以通过简单的指令生成小游戏、数据图表、网站和简历等多种应用。只需访问通义网页版并点击「代码模式」,用户即可开始体验这一便捷的功能。


「代码模式」的核心在于其动态窗口,它能够将用户输入的简单指令转换成实际的代码,并直接在网页上渲染成应用,支持预览和分享。这一模式基于通义强大的Qwen2.5-Coder代码模型,该模型在多项基准评测中表现出色,确保了AI编程的性能和效率。


通义「代码模式」的推出,旨在降低编程的门槛,让每个人都能轻松将创意转化为现实,使应用开发变得更加便捷和普及。这一功能的实现,不仅为非技术用户提供了实现创意的工具,也为教育和初学者提供了学习编程的途径。



阿里大数据开发治理平台 DataWorks基于StarRocks,打造标准湖仓新范式


阿里DataWorks基于大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为用户带来智能化的数据开发和分析体验。而阿里云提供的 EMR Serverless StarRocks 全托管服务(下文简称 StarRocks),专注于实时分析场景,可提供高性能、全场景、极速统一的数据分析体验。


目前,已支持将 DataWorks 和 StarRocks 结合使用, 以 StarRocks 作为引擎层,以 DataWorks 作为数据开发与治理平台,形成组合拳,帮助企业用户通过 DataWorks 的产品界面来灵活地访问和使用 StarRocks,并且实现一系列的数据操作,例如:数据建模、数据的同步与集成、数据的开发与调度、数据治理、数据分析与服务等。通过该解决方案,帮助数仓团队实现 OLAP 的分析、湖仓一体的开发以及数据综合治理等一系列的应用场景和目标。这样一来,可以满足复杂业务场景下对于数据仓库和分析系统的需求,提供一站式的数据处理和分析能力,帮助企业更好地释放数据价值。


DataWorks结合StarRocks引擎在数据分析和数据服务上的极速表现,全面助力 StarRocks 在数据开发、数据消费和数据治理场景上的使用。在数据开发的整个生命周期中,涵盖从数据采集到最终数据分析与应用的多个关键环节。其中,数据同步、数据开发、调度运行以及运维监控是四个尤为重要的组成部分。DataWorks 在这几个方面均展现出了卓越的能力,为企业级大数据处理提供了一站式的解决方案。

高性能低侵入,金仓KFS助力老系统焕新生


老旧系统升级难,数据迁移成瓶颈。目前客户老旧系统迁移过程中会担心数据同步软件的权限使用对源端生产库造成较大的侵入性影响、老系统资源紧张担心数据同步软件的资源使用影响系统的正常运行。


针对用户的这些痛点,金仓推出KFS异构数据同步软件,数据实时同步性能高、侵入小,能够确保数据一致,助力企业无忧升级,是企业系统改造的最佳选择。产品具有低侵入、高性能的特性:


· 支持分离/集中部署:分离部署不占用数据库资源,集中部署最小占用数据库1核CPU,2G内存;


· 支持资源限额:支持对CPU、内存和网络带宽的资源使用限额;


· 数据库最小权限下的数据同步:严格遵循最小化权限原则,只需要生产数据库部分对象的只读权限即可进行增量数据的同步;


· 高效的同步性能:金仓专利的数据库日志增量捕获技术,秒级同步时延。

腾讯云数据资产管理能力获IDC认可,WeData获七项满分


近日,国际数据公司IDC发布了《IDC TechAssessment:数据资产平台技术能力评估,2024》(Doc# CHC52204925,2024年10月)报告。报告聚焦数据资产管理平台的市场现状与技术趋势,深入分析了发展前景、行业应用、技术趋势、产品能力等多个方面,腾讯云凭借其WeData一站式数据治理平台和大数据处理能力,在数据集成与存储、数据治理、数据资产化、生态等七个维度获得满分。

WeData 是腾讯云推出的一站式数据开发治理平台,包含数据集成、开发、测试、运维的全链路 DataOps 数据开发能力,以及数据建模、数据质量、数据安全、数据资产等一系列数据治理和数据运营能力,帮助企业在数据构建和应用的过程中实现降本增效,数据价值最大化。


WeData与腾讯云TBDS深度结合,不仅支持企业构建数据湖、数据仓库,更通过开放多种存算组件,为企业构建全周期数据资产管理体系提供坚实支撑。

WeData基于腾讯云安全提供全方面的大数据安全保障,通过数据审计、敏感数据识别,数据分类分级、数据脱敏、权限控制等能力,集中化管控数据安全和协作机制,保障企业数据安全地流通。


腾讯云基于大模型技术的BI智能分析助手ChatBI,能够快速、直观地展现数据洞察,显著提升了数据分析的智能化和便捷性,为企业提供了从数据到决策的高效桥梁。


IDC发布RAG与向量数据库市场前景预测


IDC于近日发布了《RAG与向量数据库市场前景预测》,当前,RAG与向量数据库是AI厂商布局的重点方向之一。2023年全球非结构化数据占比达到92.9%,用户需要更好地管理、治理这些数据从而用于更精准的分析和AI内容生成。

在生成式AI开发过程中,41%的高管认为搭建RAG架构非常重要,81%的IT领导者认为利用自己业务数据的GenAI模型将使他们比竞争对手具有明显优势。RAG为LLM提供企业内部数据,使生成内容更加准确合理,已在知识问答、对话查询、任务执行等应用中集成。未来两年,企业表示将在营销、网络安全、知识管理和发现等领域中更多采用RAG。


原生向量数据库、向量检索引擎作为实现RAG的重要组成,最先落地的客户和场景包括银行(客服、知识库)、制造业(故障检测)、汽车(知识库、图片相似性搜索)、搜索(相似性搜索)等。从需求来看,大部分客户对RAG和向量数据库的区别还没有明确认知,更多从成本和难易程度的角度来考虑建设方式,同时随着文档数量的上升,也更关注如何组织逻辑、评估效果。


原生和非原生向量数据库将长期并存,成本、部署难度以及大模型/Agent套件服务将会是影响企业选择的最重要因素。即使存在性能差距,但均可以通过改善工程实现优化。原生向量数据库在可扩展性、准确率、数据规模、QPS等上有优势,以及自研embedding模型,会提高LLM生成内容的效果和精准度,但影响模型效果的因素还包括数据的前期处理、LLM模型本身效果、检索后重排序、Prompt等多个方面,且各技术解决方案均会集成ANN、HSNW、Graph等最新算法,之间壁垒并不明显。


向量数据库市场主要由GenAI带动,多为大模型服务项目总包中的一部分,仅有少量商业化解决方案落地,例如银行保险行业,2024年各企业在向量数据库项目上的营收规模大多集中在3000-5000万,其整体市场也面临着RAG开源检索引擎、LLMOps工具的影响。


国外资讯


Elastic 宣布推出 AI 生态系统,加速 GenAI 应用程序开发


Elastic宣布推出其 AI 生态系统,以帮助企业开发人员加速构建和部署检索增强生成 (RAG) 应用程序。Elastic AI 生态系统为开发人员提供了一套精心挑选的、全面的 AI 技术和工具,与 Elasticsearch 向量数据库集成,旨在加快上市时间、ROI 交付和创新。


Elastic AI 生态系统为开发人员提供来自业界领先的 AI 公司可信网络的预构建 Elasticsearch向量数据库集成,从而实现对 AI 模型、云基础设施、MLOps 框架、数据准备和提取平台以及 AI 安全和运营中 GenAI 应用程序关键组件的无缝访问。这些集成可帮助开发人员:


· 通过 RAG 提供更多相关体验。

· 准备并获取来自多个来源的数据。

· 试验并评估人工智能模型。

· 利用 GenAI 开发框架。

· 观察并安全部署人工智能应用程序。


Elastic AI 生态系统包括与阿里云、亚马逊网络服务 (AWS)、Anthropic 的 Claude、Cohere、Confluent、Dataiku、DataRobot、Galileo、谷歌云、Hugging Face、LangChain、LlamaIndex、微软、Mistral AI、NVIDIA、OpenAI、Protect AI、RedHat、Vectorize 和 Unstructured 的集成。


Databricks 获得 AWS GovCloud 上 DoD IL5 的授权


数据和人工智能公司Databricks宣布,它已获得美国国防部 (DoD) 云计算安全要求指南影响等级 5 (IL5) 临时授权 (PA),用于Amazon Web Services (AWS) GovCloud 上的 Databricks 数据智能平台。AWS GovCloud 上的 Databricks 现已全面推出。


Databricks 数据智能平台将客户数据与针对其业务独特特征的强大 AI 模型相结合,使分析和智能应用程序的访问变得民主化。该平台建立在开放数据格式和开放治理的 Lakehouse 基础上,以确保所有数据完全在客户的控制范围内。Databricks 帮助包括国防部在内的联邦机构采用数据网格框架来改善数据访问、安全性和可扩展性。包括 Unity Catalog 和 Delta Sharing 在内的关键平台组件促进了跨域和组织边界的数据治理、访问控制和安全数据共享。这种设置允许机构创建特定领域的见解并向其他领域提供数据产品,确保遵守组织规则和行业法规。


凭借此项授权,美国国防部、其任务合作伙伴和部分联邦机构现在可以使用 Databricks 管理高度敏感的数据,包括受控非机密信息 (CUI) 和非机密国家安全信息 (U-NSI)。Databricks 的 IL5 PA 包括联邦风险与授权管理计划 (FedRAMP) High 基线。基于 Databricks 的 AWS GovCloud FedRAMP High Agency ATO 授权、Azure Databricks 的 FedRAMP High 和 IL5 授权以及对国际武器贸易条例 (ITAR) 用例的支持,这些成就表明了 Databricks 致力于向美国政府提供数据情报。

SAS 收购英国合成数据平台 Hazy 的知识产权,增强 AI 产品组合


SAS Institute 收购了总部位于英国的合成数据初创公司 Hazy Ltd. 的知识产权,以增强其人工智能产品,此次收购未披露具体条款。收购将使 SAS 能够为客户提供创建 AI 工作负载合成数据的工具。


Hazy 的平台能够生成不暴露敏感或可识别信息的合成数据,复制真实数据集的统计模式,解决受监管行业中的隐私和合规问题。SAS 计划将 Hazy 的技术整合到其 SAS Data Maker 平台中,以创建更丰富、符合隐私要求的合成数据集,加速 AI 项目。这一增强能力还将与 SAS Viya 集成,SAS Viya 是其用于编排 OpenAI 的 GPT-4 和 Google 的 Gemini Pro 等高级模型的旗舰 AI 平台。


此次收购使 SAS 成为数据管理和 AI 开发领域的领导者,提供成本效益高且可靠的合成数据解决方案。分析师强调了合成数据在医疗和金融等隐私敏感行业中的重要性,以解决数据稀缺问题并提高模型准确性。SAS 计划在 2025 年初预览增强的 SAS Data Maker,这是推进可信 AI 系统的重要一步。


马斯克修改对 OpenAI 的诉讼,新增微软等被告


马斯克对 OpenAI 的诉讼在7月撤回后,8 月重新提起,并在修改后的诉状中新增了微软、LinkedIn 联合创始人里德·霍夫曼和前 OpenAI 董事会成员、微软副总裁迪伊·坦普尔顿等被告。新诉状还增加了新的原告, 包括 Neuralink 高管和前 OpenAI 董事会成员希冯·齐里斯以及马斯克的 AI 公司 xAI。马斯克曾是 OpenAI 的创始人之一, 该公司最初作为非营利组织成立, 旨在研究和发展有益于人类的 AI 技术。马斯克于 2018 年离开 OpenAI, 原因是与公司方向存在分歧。马斯克在之前的诉讼中指控 OpenAI 利用他对 AI 技术潜在危害的担忧, 骗取了他捐赠的超过 4400 万美元。他还指控 OpenAI 联合创始人兼 CEO 萨姆·奥特曼在 OpenAI 与其他奥特曼参与的公司之间进行“猖獗的自利交易”, 以谋取个人利益。在最新提交的诉状中, 马斯克的律师指控 OpenAI 现在“积极试图消除 xAI 等竞争对手”, 并通过“从投资者那里提取不资助他们的承诺”来实现这一目标。诉状还指控 OpenAI 不公平地受益于微软的基础设施和专业知识, 马斯克的律师将其描述为“事实上的合并”。


行业资讯


【金融】央行反洗钱局王静:充分发挥金融机构反洗钱第一道防线作用


11月15日,中国人民银行反洗钱局副局长王静在“第十四届中国反洗钱高峰论坛暨第四届陆家嘴国家金融安全峰会”上指出,积极推动打击治理洗钱违法犯罪工作还需从四方面着手:一是夯实制度基础,依法开展打击治理工作。新修订的《反洗钱法》为防范打击洗钱犯罪提供了有力法律保障。二是加强协作配合,提升工作合力。加快修订《反洗钱工作部际联席会议制度》,明确任务分工,强化部门协作。三是坚持严厉打击,遏制洗钱犯罪蔓延态势。认真研究新型洗钱犯罪特点,加大对专业团伙洗钱、复杂洗钱、跨境洗钱等洗钱犯罪的打击力度。四是加强源头治理,健全洗钱风险防控体系。强化反洗钱监管,指导金融机构进一步完善风险管理措施,增强洗钱风险识别和防控能力,及时整改洗钱风险隐患,充分发挥金融机构反洗钱第一道防线作用。


政府】数字广州建设未来十年总体规划发布


近日,广州市人民政府印发了《数字广州建设总体规划》(以下简称《规划》),这是广州首次从顶层设计维度,高标准、多角度、全方位描绘了“数字广州”发展蓝图。


《规划》提出,到2030年,力争建成数字中国标杆城市,数字基础设施建设保持全国领先,数据要素市场化配置改革成效显著,城市全域数字化转型全面突破,形成一批具有世界影响力的数字产业集群。展望2035年,力争成为全球数字科技及产业创新高地,数字活力全面激发,数字基础设施达到世界先进水准,走出一条超大城市全域数字化转型新路径,人民群众享有更加美好的数字生活,率先实现社会主义现代化。


《规划》共7章24节,提出了“13535”的总体架构,涵盖了数字经济、数字政务、数字文化、数字社会、数字生态文明“五位一体”全域数字化转型的方方面面。《规划》提出,广州将从构建数据优质供给资源池、创建数据可信流通大市场、激发数据开发利用新活力三方面构建数据要素赋能体系。


国内政策资讯


数字中国建设工作推进会议在北京召开


近日,国家数据局会同有关部门召开数字中国建设工作推进会议。会议指出,今年以来,各地区各部门积极作为、攻坚克难,大力推动数据要素市场化配置改革,积极推进数字中国建设各项任务,在数字经济、数字政务、数字文化、数字社会、数字生态文明等领域取得明显成效。


下一步,要以习近平新时代中国特色社会主义思想为指导,因地制宜、多措并举、大力推进,努力完成《数字中国建设整体布局规划》2025年阶段性目标。持续深化数据要素市场化配置改革。健全完善数据基础制度,推动出台企业数据开发利用、数据产业高质量发展等政策文件,加强数据基础设施和标准化建设,着力繁荣数据产业生态。健全数字中国建设工作体制机制。充分发挥现有工作机制作用,加强工作体系建设,凝聚各方力量,推动跨部门协同和纵向联动,统筹做好各方面政策措施的有效衔接。进一步落实主体责任。


国家数据局将加强统筹协调、整体推进。有关部门按照职责职能,制定政策措施,强化资源整合,形成工作合力。各地区要充分发挥数据管理机构职能作用,将数字化发展摆在本地区工作重要位置。营造良好发展氛围。统筹开展试点试验,持续挖掘典型案例,及时总结推广。继续谋划办好数字中国建设峰会、中国国际大数据产业博览会等重大活动,搭建宣传交流合作平台,广泛凝聚发展共识。

工信部:推动中小企业数字化转型 到2027年上云率将超40%


近日,第十九届中国国际中小企业博览会在广州开幕。工业和信息化部相关负责人透露,将联合相关部门印发《中小企业数字化赋能专项行动方案(2025—2027年)》;并通过新发布的大企业技术创新需求榜单,促进大中小企业融通创新。


据了解,《中小企业数字化赋能专项行动方案(2025—2027年)》将明确未来3年推动中小企业数字化转型的主要思路和重点任务。核心内容包括,将发挥中央财政资金引导作用,分批支持100个左右城市开展转型试点、4万多家中小企业深度改造。

工业和信息化部部长金壮龙表示,大力发展“小快精准”数字化产品和解决方案,让更多中小企业敢转、会转、转得好。我们计划到2027年,实现“小巨人”企业数字化改造全覆盖。


根据《中小企业数字化赋能专项行动方案(2025—2027年)》,到2027年中小企业上云率将超过40%。工信部相关负责人介绍,后续还将重点推进中小企业数字化“链式转型”。工业和信息化部中小企业局局长梁志峰表示,充分发挥链主企业、平台企业、集群园区的资源汇聚作用,通过订单牵引、技术扩散、资源共享等“资源+工具”的方式,牵引中小企业开展改造,推动链群融通转型。


扫码关注我们

扫码关注我们

END

文章转载自Hadoop大数据应用,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论