
新闻速递

1.IDC发布“2022年中国大数据平台市场报告”,星环科技市场份额处于第一阵营
2.星环科技大数据基础平台TDH社区开发版发布,单机30s极速安装即可上手体验
3.中国大数据产业发展观察:持续向上向好
4.中国信通院发布《云计算白皮书(2023年)》,我国云计算市场规模达4550亿元
大数据
5.UCloud推出智能大数据平台 USDP v3.1,五大功能扩展,提升安全、易用的大数据生态服务
6.永洪BI V10.1重磅发布,超200项更新,支持3D模型&电子表格等
7.自动驾驶AI数据服务提供商「柏川数据」完成1000万天使轮融资
8.Teradata收购Stemma以提供增强的AI和ML分析
9.云智慧正式发布首个商用运维大语言模型产品CloudwiseGPT
数据库
10.Amazon OpenSearch Serverless向量引擎预览版推出 助力客户轻松构建生成式AI应用
11.腾讯云向量数据库正式上线公测!提供10亿级向量检索能力
12.DBI Software发布DBI Performance Web Suite 9
13.“上海数据二十条”来了,推动数据国际化交易
14.信通院发布可信数网(TDN)框架,星环科技参与
15.翼方健数发布数据协作网络产品CCN,助力安全开放的数据流通生态
16.网络安全解决方案提供商「固源科技」完成1000万Pre-A轮融资
17.针对银行业的开源软件供应链攻击激增
AI
19.Oracle公布生成式AI的三大策略
20.用友发布业界首个企业服务大模型YonGPT
21.AI神器Copilot大升级,百万开发者动嘴编码5年内成真
22.旷视科技发布全新轻量级LLM 模型推理框架 InferLLM,助力大模型实现落地
23.SAP对多家AI公司进行战略投资,以进一步实现其业务AI愿景
每周热点


1.IDC发布“2022年中国大数据平台市场报告”,星环科技市场份额处于第一阵营
IDC于近日发布了《中国大数据平台市场份额,2022》报告,报告显示,2022年中国大数据私有化部署市场规模达94.3亿元人民币,大数据平台公有云服务市场规模达49.6亿元人民币。在云厂商的大力驱动下,公有云部署方式的大数据市场规模进一步提高。

报告认为,大数据市场增长保持平稳,但市场生态日益复杂,产业发展愈加呈现出与全球脱轨的趋势:全球市场基于较好的数字化转型基础,大数据市场能够培育出众多细分软件市场,且边界清晰;而中国市场在数据智能的大趋势下,只有几个诸如数据治理、大数据平台、商业智能、智能决策等单点市场。这一现象短期内不会改变,行业参与者在抓住市场机会扩大自身规模的同时,也应关注全球大数据市场走向,帮助用户真正的实现数字化转型。


2.星环科技大数据基础平台TDH社区开发版发布,单机30s极速安装即可上手体验
近日,星环科技大数据基础平台TDH社区版正式发布了全新的社区开发版,单机即可安装部署,整个安装过程仅需30s,真正做到开箱即用,大幅降低了用户的资源成本和使用门槛。此外,TDH社区版发布了V23-5,强化了运维管理能力的同时,新增了搜索引擎以及图数据库能力支撑,进一步提升了平台的多模型能力。
社区开发版仅需单台服务器即可快速安装部署,降低资源成本的同时充分提升了开发效率。
开箱即用:社区开发版采用了all-in-one全内置设计,开箱即可用,最快仅需30s即可一键启动,用户无需花费大量时间和精力来进行环境配置、安装部署,大幅提高了用户的使用体验。

低成本:社区开发版单机即可部署,极大降低用户的资源成本。自研的统一SQL引擎进一步降低了用户的整体学习成本和应用开发门槛,不同业务的开发团队可以使用统一的接口快速、灵活地调用数据,提高业务开发效率。
便捷开发、智能运维:社区开发版不仅提供了星环极具竞争力、成熟的核心组件关系型分析引擎Inceptor以及宽表数据库Hyperbase 等,还配套提供了丰富的开发管理套件,提高了数据管理和开发的效率。


3.中国大数据产业发展观察:持续向上向好
在2023大数据产业发展大会主论坛上,中国信通院云计算与大数据研究所大数据与区块链部主任姜春宇进行了题为大数据产业发展观察的演讲。大数据产业经过多年的发展,现在已经进入“十四五”发展阶段,整个态势非常好、动力非常充足,产业规模达到1.57万亿,数据产量是ZB级别,很多企业数据规模都是PB,国家层面是ZB级别,论文专利也是在全球处于领先地位,和数据有关的市场主体超18万家,高校数据领域的课程也逐渐丰富起来。
在数据基础设施方面,整体创新已经完成,接下来是围绕降本增效、面向大模型、数据要素和安全能力的点状创新。在数据管理方面,随着整体意识的激活,DataOps已经成为迫切需求。在数据流通方面,由于公共数据是当前热点,地方实践集中在这个部分;商业数据需要构建场内外结合体系,个人数据使用之道需要个人数据账号与隐私工程探索,可信数据流通技术体系目前已经初步形成。在数据应用方面,AI技术的增强会带来一个新的变化,企业组织架构需要围绕数据进行新的调整,数据分析能力在向平民化演进。在数据安全方面,数据安全防线评估和治理提上日程,体系化的数据安全治理能力成为大多数企业的选择,数据分类分级开始大范围落地,方法论和工具逐渐成熟,但仍需大量的迭代和优化工作。


4.中国信通院发布《云计算白皮书(2023年)》,我国云计算市场规模达4550亿元
中国信通院正式发布《云计算白皮书(2023年)》。这是中国信息通信研究院第九次发布云计算白皮书。本次白皮书聚焦过去一年多来云计算产业的新发展新变化,总结梳理国内外云计算政策、市场、技术、应用等方面的发展特点,并对未来发展进行展望。核心观点包括:
·云计算战略价值在全球范围内持续提升
·全球云计算市场稳定增长,我国保持快速发展。2022年全球云计算市场规模为4910亿美元,我国云计算市场规模达4550亿元,较2021年增长40.91%。
·云计算产业环境日益激烈,新一轮竞争全面开启
·云计算技术不断推陈出新,助力产业高质量发展
·行业上云用云呈阶梯状分布,中小企业成影响上云进程关键
·数字应用方式与算力资源供给变革,云计算向数字世界操作系统转变
大数据


5.UCloud推出智能大数据平台 USDP v3.1,五大功能扩展,提升安全、易用的大数据生态服务
近日,优刻得UCloud全面升级USDP智能大数据平台,推出V3.1版本,该版本引入了数据湖架构组件及相关易用性的服务,并增强了集群、服务和主机等层面的自定义监控图表功能;同时优化解决了 v3.0 版本中的一些已知问题,在安全性、易用性和性能方面进行了重大提升,为企业带来了更安全、更高效的大数据生态体验。现有 v3.0 版本的用户平台和集群均可平滑升级到最新版本。
为了满足日益增长的数据处理和分析需求,以及对数据分析时效性、存储管理的要求,USDP v3.1 版本中,引入了 Hudi、Iceberg 和 Canal 等组件,进一步丰富了USDP的大数据服务生态,为用户提供全面的数据管理解决方案。
加强了安全性措施,提供更全面的数据保护和管理功能。引入了 LDAP 服务可视化配置集成功能,可以大幅简化手动管理和配置 LDAP 服务的复杂性。
集群资源池管理配置功能为用户提供了便捷的管理工具,可以对 YARN 和 Impala 的集群资源池进行可视化动态配置。
新增的自定义监控图表功能,使用户可以按照业务关注点自主选择关键的监控指标,并以图表化方式展示,实现对集群、主机和大数据服务关键状态反馈的快速捕获。用户可以根据自己的需求进行指标汇总、对比等处理,便捷地获得所关注的监控数据图表化呈现。


6.永洪BI V10.1发布,超200项更新,支持3D模型&电子表格等
永洪BI V10.1版本正式上线。永洪BI V10.1带来了一系列令人振奋的新功能和改进,为企业的数字化转型提供更多的价值和助力。
新版本提升数据可视化和数据分析功能,以及在帮助企业实现数据驱动决策方面表现出色。此外,新版本中包含的新技术和工具,以帮助企业更有效地进行数据处理和挖掘。


7.自动驾驶AI数据服务提供商「柏川数据」完成1000万天使轮融资
柏川数据是一家自动驾驶AI数据服务提供商,主要面向主机厂、自动驾驶解决方案商提供数据采集、清洗、标注、管理、存储的一站式服务,覆盖单车智能、车路协同、智能座舱三大场景。
近日,柏川数据完成千万元天使轮融资,由国内知名创投机构同创伟业独家投资。本轮融资将主要用于技术研发和团队搭建,进一步扩大公司市场占有率。
柏川数据主要提供数据的「采集、清洗、标注、管理、存储」一站式服务,并聚焦自动化标注、数据闭环系统和4D标注,为单车智能、车路协同、智能座舱三大自动驾驶解决方案提供落地支撑。
在专精于自动驾驶数据服务的同时,柏川数据积累了大量高度复杂的AI视觉场景处理经验,能以「维度优势」拓展AIGC、智能机器人、智慧工业、智慧城市等多个行业领域的数据智能服务业务。


8.Teradata收购Stemma以提供增强的AI和ML分析
“Stemma正在帮助重新定义企业如何找到可靠的数据,并随时随地提供始终如一的最新数据视图。专注于人工智能增强的数据搜索和探索,我们预计Stemma将扩大Teradata的能力,提供从发现到交付的变革性分析价值,“Teradata首席产品官Hillary Ashton说。“Stemma的自动化数据目录功能将帮助Teradata提供增强的用户体验,旨在加速AI和ML分析蓬勃发展领域的增长。我们很高兴欢迎 Stemma 强大的工程师和元数据专家团队帮助推进 Teradata 在数据沿袭、数据治理和数据合规性方面的产品路线图,所有这些都推动了人工智能时代更好的自助式分析。
Stemma 成立于 2020 年,以其创新和熟练使用人工智能和机器学习而闻名,可帮助用户更有效地发现、信任和使用他们的数据和元数据。
Stemma 的解决方案旨在提供高级安全性、增强的易用性数据搜索功能和自动化数据智能。Teradata表示,凭借20个内置数据连接器,Stemma强大的数据目录解决方案将增强Teradata的数据结构,并加速Vantage平台的分析生产力。


9.云智慧正式发布首个商用运维大语言模型产品CloudwiseGPT
云智慧正式发布首个商用运维大语言模型产品CloudwiseGPT。它是自主构建的微调集上可以进行微调的大语言模型,该数据集沉淀了丰富的运维知识库和全栈运维场景,并涵盖了广泛的IT相关信息。
CloudwiseGPT能帮助客户分析和解决日常运维工作遇到的各类问题,极大的提高了IT部门的效率,运维大语言模型的应用创新也为IT运维带来革命性的变化。
目前,CloudwiseGPT已经在金融、能源、运营商等行业头部客户成功落地应用。CloudwiseGPT,作为智能运维行业的新篇章,将为IT带来前所未有的变革。它将引领我们走向更高效、更智能的领域,我们期待与客户并肩而行,共同探索运维大语言模型充满无限可能的未来。
数据库


10.Amazon OpenSearch Serverless向量引擎预览版推出 助力客户轻松构建生成式AI应用
亚马逊云科技宣布推出Amazon OpenSearch Serverless向量引擎预览版。该向量引擎在Amazon OpenSearch Serverless中提供了一种简单、可扩展、高性能的相似性搜索功能,让用户能够轻松构建由现代化机器学习(ML)增强的搜索体验和生成式AI应用程序,无需管理底层向量数据库基础设施。
亚马逊云科技还提供以下选项满足更高级的向量数据存储需求:
• Amazon Aurora PostgreSQL兼容版关系型数据库,支持pgvector开源向量相似性搜索插件
• 分布式搜索和分析服务Amazon OpenSearch,带有k-NN(k最近邻)插件和适用于Amazon OpenSearch Serverless的向量引擎
• 兼容PostgreSQL的Amazon RDS(Amazon Relational Database Service)关系型数据库,支持pgvector插件。


11.腾讯云向量数据库正式上线公测!提供10亿级向量检索能力


12.DBI Software发布DBI Performance Web Suite 9
DBI Software 是 IBM Db2 LUW 和 SQL Server 数据库的性能监控、调优和趋势工具提供商,DBI Web Performance Suite for SQL Server and DB2 是一个数据库 性能收集、分析和推荐工具可帮助您对数据库系统进行故障排除和调整。目前,DBI Software 正在发布 DBI Performance Web Suite 的第 9 版。
DBI Performance Web Suite 9包括许多新功能和增强功能,例如顶级查询资源和降级分析器、历史锁、带有相关视图链接的建议、Web 套件的 Linux 版本以及对 Edge 的支持。
新版本的亮点包括针对 CPU、执行时间、效率和降级的热门查询分析器。用户可以查看历史锁和锁定请求(包括语句)(SS),并查看实时锁定和锁定请求,包括语句(SS)。
数据安全


13.“上海数据二十条”来了,推动数据国际化交易
《规定(草案)》共二十条,主要内容包括界定各方责任,明确促进数据流通交易的总体要求;结合落实《数据二十条》,探索细化数据产权分置机制;建立数据流通交易的系列规则,进一步培育壮大场内交易,并对场外交易作出适度规范引导;进一步培育数据市场生态,营造良好发展环境。
《规定(草案)》明确支持上海数据交易所国际板块和国际数据港建设,推动数据国际化交易。


14.信通院发布可信数网(TDN)框架,星环科技参与
在2023隐私计算大会上,中国信通院发布了“可信数网(TDN) 框架”,以及“可信数网测试床”和“隐私计算互联互通第二批试点项目”,并联合项目共建方一同启动了成果的发布仪式,星环科技参与其中。
数据流通的本质是数据怎样安全、高效、合规地从提供方流转到需求方的过程,其中涉及数据加工、治理、算法、算力、APP服务、IT基础设施等多个中间方,以及需要对流通全过程进行存证、监控,满足监管方的要求。在此条件下,可信数据流通网络(TDN,简称可信数网)就应运而生。它是数据流通中各个参与方在互认、互信、互联的原则下,通过“织点成域、联域成网”,形成的跨区域、跨行业、跨主体的数据流通基础设施。它为解决数据供给不充足、机构相互不信任、安全流通无范式、数据使用不可控等问题提供一种新的解决路径。
为了实现可信数网互信、互认、互联的目标,中国信通院联合行业内多家单位共同建设了可信数网测试床。参考TDN的功能框架设计了多个功能层级的十余项测试功能,目前已完成了部分关键能力的建设。


15.翼方健数发布数据协作网络产品CCN,助力安全开放的数据流通生态
翼方健数在医疗领域推出基于隐私计算的多中心科研专病协作网络CCN(Clinical Collaboration Network ),在非医疗领域同时推出安全数据协作网络CCN 1.0版本。CCN是基于翼方自研的翼数坊主版构建的分布式数据协作网络产品,旨在解决多个机构法人组织(如医疗机构、高校、科研机构、集团企业)间,多信任域条件下的数据价值安全有序流通挑战。为了构建这个网络,CCN需要在至少2个机构组织之间独立部署翼数坊主版(每个独立部署被称为一个节点),通过这些节点的连接,形成节点网络,实现数据在不同机构之间的安全传输和共享。
在数据协作网络中,主导方需部署节点管理器(Broker),成为主节点;参与方为一般网络节点。节点管理器负责分布式数据协作网络中所有网络节点对象的管理、任务编排等。通过分布式数据探查与应用、可配置的数据计算场景、支持“原始数据不出域、数据可用不可见”的应用方式,实现数据安全协作共享。CCN将成为医学、生命科学、金融,营销等众多科学和行业实现数据产业化的关键基础设施。


16.网络安全解决方案提供商「固源科技」完成1000万Pre-A轮融资
日前,固源芯创微(安徽)科技有限公司(以下简称“固源科技”)获得千万级 Pre-A 轮融资。此轮融资主要用于加强现有技术研发和新产品发布, 并通过加强与西安电子科技大学芜湖研究院的产学研合作, 助力网络安全产业的蓬勃发展。
固源科技专注于国产自主可控的模糊(Fuzzer)漏洞挖掘技术的研究,公司目前具有适用于 SDLC 全生命周期的安全检测工具系列产品,具有独特的技术路径和经验积累,安全检测产品主要应用于智能汽车、工业控制、电力能源等行业和领域,已先后帮助国内外多个知名客户进行漏洞的挖掘与修复。


17.针对银行业的开源软件供应链攻击激增
网络安全研究人员在金融领域发现了一个令人担忧的发现——专门针对银行业的开源软件供应链攻击激增。
根据Checkmarx最近的一份报告,这些攻击采用了先进的技术,特别是针对目标银行网络资产中的某些组件。通过将恶意功能附加到这些组件,攻击者正在获得未经授权的访问权限并对金融机构造成严重破坏。
随着银行业面临这种不断变化的网络威胁形势,网络安全专家敦促金融机构加强防御,密切监控其供应链,并对试图利用开源软件生态系统中漏洞的恶意行为者保持警惕。
AI


18.利用AI技术保障配电房生产安全,星环科技荣获“电力行业边缘计算优秀实践奖”
近日,中国通信标准化协会算网融合产业及标准推进委员会(CCSA TC621)组织召开“边缘计算产业发展论坛”,会上正式公布“2022边缘计算优秀案例”征集活动入围名单。星环科技凭借“基于深度学习的配电房视频识别研究与应用”荣获“2022年度电力行业边缘计算优秀实践奖”。
星环科技此次获奖案例“基于深度学习的配电房视频识别研究与应用”,针对南方电网某省供电局在配电房使用管理过程中出现的问题,运用智能识别分析技术实现了人脸识别、穿戴规范、开关柜状态识别、设备台账识别、异物检测、油位辨别、危险源检测、红外测温智能预警等功能模块,并以边缘计算整合物联设备、融合人工智能算法来提供实时视频识别技术“云边一体化”完整解决方案,可以实时了解现场工作人员的状态、防止现场工作人员误操作,降低了作业风险,提高了供电企业对安全行为的管控力度和管控效率,保障了工作人员的生命安全和配电房的生产安全。
在具体的实施过程中,借助星环科技边缘计算平台Sophon Edge,将云AI能力释放到边缘端。Sophon Edge平台提供云端Edge Hub和边缘端Edge Node的两个子模块,并与接入平台的设备端,形成“云边端一体化协同”,将标准化的云原生能力向边缘端复制。


首先,为大规模训练和服务模型提供强大的基础设施。通过与 NVIDIA 合作,可以为客户提供超级集群。该集群由市场上较新的 GPU 提供支持,并通过超低延迟的 RDMA over Converged Ethernet (RoCE) 网络相连。此解决方案提供了一种高性能、经济高效的大规模 AI 模型训练方法。Adept 和 MosaicML 等许多 AI 初创公司都直接在 OCI 上构建产品。
其次,在完全托管的部署环境中,为开发人员和科学家提供简单易用的云技术服务。同时,和Cohere合作提供新的生成式 AI 服务和业务功能。Cohere主要提供企业级大型语言模型 (LLM),Oracle将与Cohere携手构建新的生成式 AI 服务。即将推出的OCI Generative AI支持OCI 客户通过简单的 API,为自己的应用和工作流添加生成式 AI 功能。
第三,将生成式模型嵌入到业务用户每天使用的应用和工作流中。Oracle计划将Cohere的生成式AI嵌入到Fusion、NetSuite 和垂直软件即服务 (SaaS) 产品组合中,以创建能够立即为组织提供生成式 AI 功能的解决方案。Oracle 可以为各个行业的组织提供基于生成式 AI 的原生功能,助其实现关键业务功能自动化,改善决策并提升客户体验。


20.用友发布业界首个企业服务大模型YonGPT
YonGPT采用了最新的人工智能技术,结合了用友在企业服务领域35年的经验积累、领先并场景丰富的企业应用软件产品、大规模企业客户基础的优势,它的发布标志着中国企业软件的创新迈入以人工智能为中心的新阶段。
YonGPT是用友商业创新平台-用友BIP的重要组成,能够底层适配业界主流的通用语言大模型,通过提供通用能力服务、领域服务及行业服务,实现业务运营、人机交互、知识生成及应用生成4个方面的企业智能化。
YonGPT通过上下文记忆、知识/库表索引、Prompt工程、Agent执行、通用工具集等扩充大模型的存储记忆、适配应用和调度执行能力,再结合财税、人力、供应链、研发等领域的知识和最佳实践扩充大模型专业能力,从而形成体系化的企业服务大模型。另外,YonGPT还优化了企业服务大模型的训练效率和成本,集成了丰富的开发工具和优化算法,通过自有的数据管理、大模型精调、大模型评估优化、大模型推理和插件服务等功能,为大模型的构建和服务提供稳定且有效的支撑。后续YonGPT将会对用友整体产品体系进行全面的能力覆盖。


21.AI神器Copilot大升级,百万开发者动嘴编码5年内成真
AI编码神器Copilot模型升级,5年80%的代码自动生成,百万码农提速55%。
GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。
这次升级究竟改进了什么呢?第一,5年,80%代码自动生成。通过模型的改进,以及上下文过滤功能的增强,现在开发人员在写代码的时候可以获得更多量身定做的建议,满足需求。
新一代生成代码Copilot X。在微软将GPT-4能力集成到Office 365后,GitHub曾官宣发布了,基于GPT-4的新一代代码生成工具Copilot X。Copilot X提供支持的体验有:Copilot Chat;Copilot for Pull Request;Copilot for Docs;Copilot for CLI。
工作效率提升55%。升级之后的GitHub Copilot将会具有更高的代码质量,以及更快的响应速度。


22.旷视科技发布全新轻量级LLM 模型推理框架 InferLLM,助力大模型实现落地
旷视科技近日就发布了全新轻量级 LLM 模型推理框架 InferLLM,助力大模型实现落地。虽然大型语言模型在文案生成、内容创作、代码编程等方面展现了强大能力,但其海量的参数和巨大的模型体积,让大语言模型在边缘端设备上运行仍面临许多挑战。
为加速大语言模型落地应用,旷视天元开发了 InferLLM 工程,提供一个比 llama.cpp 更简单更容易上手的本地部署框架,让大语言模型在本地或者端上部署成为可能。旷视天元开源深度学习框架MegEngine是旷视科技自主研发的国产工业级深度学习框架,是旷视科技新一代AI生产力平台Brain++的最核心组件,在2020年3月正式向全球开发者开源。除了开源深度学习框架旷视天元外,旷视科技的科研成果包括AI生产力平台Brain++ 、AI算法生产平台AI Service、移动端高效卷积神经网络ShuffleNet等多项创新技术和产品。据了解,旷视科技将大模型与硬件结合,还会继续面向物联网场景打造不同类型的行业应用。


23.SAP对多家AI公司进行战略投资,以进一步实现其业务AI愿景
SAP宣布将对三家领先的生成式AI公司进行战略直接投资,进一步履行其提供相关,可靠和负责任的商业AI的承诺。
该公司表示,对Aleph Alpha GmbH,Anthropic PBC和Cohere的投资加强了SAP的开放式生态系统AI方法,利用最佳技术将AI嵌入SAP产品组合。
Aleph Alpha GmbH 是一家总部位于德国的公司,它构建了一个主权、全栈、生成式 AI 解决方案,专注于复杂和关键的企业用例。该公司专注于互操作性、数据隐私和安全性,提供人工智能即服务以及多云和本地安装。SAP此前宣布Aleph Alpha作为SAP合作伙伴,参与SAP PartnerEdge的“构建”计划。
Anthropic PBC是一家总部位于旧金山的人工智能安全和研究公司,开发有益、诚实和无害的人工智能系统。Anthropic的人工智能助手克劳德(Claude)使用了一种“宪法”方法——它根据一套以可靠性和安全性为中心的人类设计原则与用户进行交互。Claude 帮助用户完成一系列任务,包括生成答案、编码、自动化工作流程和处理文本——从编辑和重写到总结、分类等——在自然对话的上下文中。
Cohere是一家领先的企业人工智能公司,总部位于旧金山和多伦多,在伦敦设有重要的研究中心。其世界一流的技术专为业务需求量身定制,专注于易用性、可访问性、安全性和数据隐私。该技术解锁了一种更直观的方法来生成、搜索和汇总信息。

春华秋实!

扫码关注
大数据应用
从现在开始

End




