
行业快讯与友商动态 2024年第3期:
大数据在零售、营销、政务等领域的应用屡见不鲜,其实这只是大数据应用露出水面的冰山的一部分,水面下的冰山工业大数据才是大数据应用最大的市场。
工业大数据的核心在于补齐短板,服务多元场景。挖掘生产制造的价值需借助工业大数据。国内外大数据企业实践最具示范性和引领性。
本周,全国首笔应对欧盟“碳关税”数据交易达成。财政部印发《关于加强数据资产管理的指导意见》,依法合规推动数据资产化。浪潮卓数大数据发布数智金融大脑V1.0。计世资讯报告揭示谁才是信创数据库市场的领导者!
本周焦点
1.工业大数据赢在补齐短板服务场景,星环科技同时入选虎嗅智库两大专业报告
2.工业大数据:挖掘生产制造价值的新源泉
3.干货丨工业大数据的应用路径和趋势(附PPT)
4.麦肯锡:大数据如何改善制造业
大数据
5.财政部印发《关于加强数据资产管理的指导意见》,依法合规推动数据资产化
6.全国首笔应对欧盟“碳关税”数据交易达成
7.浪潮卓数大数据发布数智金融大脑V1.0,推动数据要素高水平应用
8.Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储
9.衡石科技发布HENGSHI SENSE 5.0平台,商业分析迈入AI+BI时代
10.SAS被Chartis评为反欺诈和反洗钱解决方案领导者
11.UltiHash筹集250万美元,使数据存储更具成本效益和可持续性
数据库
12.计世资讯报告揭示谁才是信创数据库市场的领导者!
13.巨杉数据库基于JSON文档型底座对SequoiaDB全面升级
14.Kinetica推出快速准确的自然语言到SQL转换产品
15.阿里云MongoDB 7.0正式发布,带来更加强大、高效、安全的数据库解决方案
16.贝格迈思创新产品“AiSQL智能数据库”获得深圳市科创委科技重大专项计划资金支持
数据安全
17.2024年我国数据安全十大发展趋势预测,公共数据安全治理迫在眉睫
18.大数据的网络安全问题:Apache Hadoop和Flink成为黑客的目标
19.数据安全厂商云集至宣布完成新一轮战略投资
20.Meta发布用于AI安全的开源工具
AI
21星环科技凭借Sophon入围Gartner®《中国人工智能软件市场指南》
22.英特尔推出针对英特尔GPU优化的全新低延迟LLM推理解决方案
23.太极股份再次增持人大金仓,加快打造国产数据库“国家队”
24.Ask-AI融资1100万美元,推出“生成式 AI Sidekick”连接50多个工作平台以摄取、分析和理解企业知识

本周焦点


1. 工业大数据赢在补齐短板服务场景,星环科技同时入选虎嗅智库两大专业报告

日前,虎嗅智库发布了《工业数据应用研究报告》和《工业数据应用解决方案落地洞察报告》,星环科技同时入选两大报告。
星环科技成功的实践表明,工业数据的使用不应该追求大而全,要根据企业现状补足数据采集、解析、存储、计算、分析等链路上的短板,选择部分场景进行“速赢”,争取在核心场景打通全流程以后,再横向扩展到其他场景,做到量变产生质变。
数据在工业领域比较常规的使用方向是对设备的运监,通过对历史数据的积累和分析,将事中告警提前至事前预测告警,减少故障对生产进度的影响以及无必要停机检修所导致的产能损失。比较新兴的使用方向是业财一体,打通产销存的过程数据,与财务数据高效融合,把事后监督改成事前事中管控,提升决策效率。
星环科技致力于打造企业级大数据基础软件,围绕数据全生命周期提供基础软件与服务。在工业领域,星环科技基于对工业数智化的产业洞察,技术积淀及工业互联网领域的丰厚经验,针对工业互联网建设痛点,打造工业互联网解决方案,为重要业务场景赋能,助力工业行业提质、降本、增效。

2.工业大数据:挖掘生产制造价值的新源泉

随着工业4.0和智能制造的深入推进,工业大数据已经成为挖掘生产制造价值的新源泉。通过大数据技术,企业可以更好地分析生产过程中的各种数据,优化生产流程,提高效率,降低成本,并为决策提供更准确、全面的支持。
工业大数据涵盖了从产品设计、原材料采购、生产制造、物流运输到销售服务的全流程数据。这些数据不仅包括结构化数据,如产品规格、生产计划等,还包括大量的非结构化数据,如设备运行状态、环境参数等。通过对这些数据的全面分析和挖掘,企业可以发现很多隐藏的价值和规律。

3.干货丨工业大数据的应用路径和趋势(附PPT)

航天科工-工业大数据国家工程实验室首席科学家邢镔发表了《工业大数据的应用路径和趋势》的主题演讲。供应链链上企业数字化需求日渐突出,企业数字化能力弱、尤其是数据不统一正在成为制约供应链和企业未来发展的瓶颈。供应链链上企业的数字化能力是提高供应链业务协同效率、资源优化匹配能力、企业生产力的核心要素,而数据统一则是关键关节。

4. 麦肯锡:大数据如何改善制造业

在过去 20 年左右的时间里,制造商已经能够通过实施精益和六西格玛计划来减少生产过程中的浪费和可变性,并显着提高产品质量和产量(每单位投入的产出量)。然而,在某些加工环境中,例如制药、化工和采矿,可变性的极端波动是生活中的一个事实,有时甚至在应用精益技术之后也是如此。鉴于影响这些行业和其他行业产量的生产活动的数量和复杂性,制造商需要一种更精细的方法来诊断和纠正工艺缺陷。高级分析就是这样一种方法。
高级分析是指将统计和其他数学工具应用于业务数据,以评估和改进实践(图表)。在制造业中,运营经理可以使用高级分析来深入研究历史流程数据,识别离散流程步骤和输入之间的模式和关系,然后优化被证明对产量影响最大的因素。许多行业和地区的全球制造商现在拥有丰富的实时车间数据,并有能力进行如此复杂的统计评估。他们正在获取以前孤立的数据集,汇总它们并对其进行分析,以揭示重要的见解。(mckinsey.com)

大数据


5.财政部印发《关于加强数据资产管理的指导意见》,依法合规推动数据资产化

近日,财政部制定印发了《关于加强数据资产管理的指导意见》。《指导意见》主要包括总体要求、主要任务、实施保障等三方面十八条内容。
一是明确工作原则,即坚持确保安全与合规利用相结合、坚持权利分置与赋能增值相结合、坚持分类分级与平等保护相结合、坚持有效市场与有为政府相结合、坚持创新方式与试点先行相结合。
二是确定主要任务,包括依法合规管理数据资产、明晰数据资产权责关系、完善数据资产相关标准、加强数据资产使用管理、稳妥推动数据资产开发利用、健全数据资产价值评估体系、畅通数据资产收益分配机制、规范数据资产销毁处置、强化数据资产过程监测、加强数据资产应急管理、完善数据资产信息披露和报告、严防数据资产价值应用风险等12方面内容。特别对具有国有属性的公共数据资产管理作出针对性规定,更好对相关主体管好用好公共数据资产提供政策指导。
三是强化实施保障,包括加强组织实施、加大政策支持、积极鼓励试点等。

6.全国首笔应对欧盟“碳关税”数据交易达成

近日,经北方大数据交易中心批准登记,全国首笔应对欧盟“碳关税”的数据产品在天津排放权交易所完成线下交易。
2023年10月1日起,全球首个“碳关税”欧盟碳边境调节机制(CBAM)启动试运行。依据CBAM规定,欧盟对从境外进口的特定产品要额外征收碳边境调节费用,产品覆盖范围包括电力、钢铁、铝业、水泥、化工、氢等六大行业。即此类行业相关产品在出口到欧盟国家时,需要提供碳排放数据,并且为商品制造时释放的温室气体数量交税。
本次交易中的受让方天津吉茂制钉有限公司属于制造业下游企业,在向欧盟出口螺钉、螺栓等产品时,应提供产品完整的碳排放报告,故需要获取上游钢铁企业——本次交易出让方天津华源线材制品有限公司在生产原材料时的排放数据。在本次交易中,双方以出口钢铁线材产品的碳排放数据为交易标的物。天津排放权交易所出具报告,确保交易数据有效性。数据产品登记及交易过程则由北方大数据交易中心合规管理并上链存证,有效助力了下游企业开展欧盟出口业务。

7.浪潮卓数大数据发布数智金融大脑V1.0,推动数据要素高水平应用

浪潮卓数大数据发布数智金融大脑V1.0,产品基于大数据、金融云、区块链及人工智能等技术,聚焦金融数据动态分析、金融需求精准感知、金融资源高效配置、金融政策精准直达、金融产业高质量发展、金融风险有效防范,强化金融服务实体经济的能力,推动区域经济协调发展。
平台实现五大功能,包括构筑数字金融基础设施,打造业务融合多跨协同,推进金融资源高效配,强化金融风险监测防控,提升经济和产业分析水平。

8.Apache Pinot 1.0发布,提供实时的分布式OLAP数据存储

Apache Pinot是一个使用Java编写的开源列式分布式数据存储系统。Pinot通过在线分析处理 (OLAP) 来响应低延迟的多维分析 (MDA) 查询。
Pinot最初在2013年作为LinkedI 的内部项目,用于支持分析解决方案,随后于2015年6月基于Apache 2 许可开源。该项目于2019 年 6月成为Apache 软件基金会的一部分。
Apache Pinot 1.0解决了300 多个问题,包括引入新特性、提高性能和 bug修复。目前该项目在 GitHub 上有130 多万行代码,由 300多名贡献者进行维护。
Apache Pinot最适合用于分析不可变的实时摄入数据,尤其是在查询具有多个维度和度量的时间序列数据时。该项目使用Apache Helix 作为集群管理嵌入式代理,使用Apache Zookeeper进行集群状态和健康的协调和维护。
Pinot 提供快速查询,能够在几十毫秒的 P90 延迟内过滤和聚合 PB 级的数据。数据可以使用流式解决方案(如 Apache Kafka、Apache Pulsar 和 AWS Kinesis)实时摄入,也可以使用 Apache Hadoop、Apache Spark 和 AWS S3 进行批量摄入。Pinot 具备了水平伸缩性和容错性。可使用 Pinot 查询语言 (PQL)、SQL 或 Trino 和 Presto SQL 查询引擎查询数据。PQL 支持类似于 SQL 的功能:选择、聚合、分组、排序和过滤。(infoq.cn)

9.衡石科技发布HENGSHI SENSE 5.0平台,商业分析迈入AI+BI时代

BI PaaS厂商衡石科技发布HENGSHI SENSE 5.0新版本,AI能力首次对外发布,独特的指标平台再次升级,指标体系结合大模型落地 AI 能力,帮助To B厂商转型为数据智能服务商。
衡石科技(hengshi.com)成立于2016年,定位为企业级“BI PaaS”,专注于打造赋能 ToB 厂商的基础能力平台。衡石核心产品HENGSHI SENSE在产品开放架构及其嵌入集成上的优势受到高度关注,能够为软件服务企业零代码构建BI分析应用,极大降低研发成本。
通过此次5.0版本的发布,衡石科技向市场及业界展示了现代分析型企业级BI的最新形态:
明确了以指标平台落地 AI 大模型的技术路线;进一步强化开放产品架构。

10.SAS被Chartis评为反欺诈和反洗钱解决方案领导者

SAS被Chartis评为Risktech象限反欺诈和反洗钱(FRAML)解决方案类别领导者。Chartis盛赞SAS的“深度分析能力全面覆盖客户生命周期的所有阶段” ,宣布SAS在所有产品完整性评估标准上获得高分,并在分析和用户界面(UI)方面排名第一,这彰显了SAS的领先优势。


11.UltiHash筹集250万美元,使数据存储更具成本效益和可持续性

UltiHash公司已经完成了250万美元的种子前融资,为推出其高性能数据存储软件铺平了道路,该软件旨在提高现有存储驱动器的容量,并帮助企业在性能和成本之间实现更好的平衡。
该公司解释说,现有的存储硬件迫使许多公司在性能和成本之间做出妥协,最昂贵的解决方案通常价格高得令人望而却步。根据 UltiHash 的说法,对于使用混合云数据基础设施的公司来说,这一挑战尤为严峻,因为数据传输速率和多供应商设置会大大增加复杂性和成本。
UltiHash 希望取得更好的平衡,帮助公司在不增加存储资源的情况下存储更多数据。它通过高性能对象存储软件实现这一点,该软件支持独立于数据类型的字节级重复数据删除,适用于任何类型的数据基础架构,甚至可以匹配每个最大的 EB 级数据集的二进制片段。(siliconangle.com)

数据库


12.计世资讯报告揭示谁才是信创数据库市场的领导者!

近日,计世资讯研究院发布《2022-2023年中国信创数据库行业市场研究报告》,从产品服务能力和市场及战略能力两个维度对市场中我国主要数据库产品服务商进行竞争力分析,星环科技凭借出色的产品服务能力和市场以及战略能力位居市场领导者。
报告指出,应用需求推动数据库技术的不断演进,总结起来体现为三个方向:1)多模数据库实现一库多用、利用统一框架支撑混合负载处理、运用 AI 实现管理自治,提升易用性、降低使用成本;2)充分利用新兴硬件、与云基础设施深度结合,增强功能、提升性能;3)利用隐私计算技术助力安全能力提升、区块链数据库辅助数据存证溯源,提升数据可信与安全。随着数据量爆发式的增长以及应用负载的快速增加,以及国产化替代的背景下,分布式数据库比集中式数据库能够更好地满足海量数据和安全性等需求。
计世资讯预测,随着基数的扩大,我国信创数据库市场规模增速将逐渐放缓并趋于平稳,但仍保持在高速增长区间,预计2025年我国信创数据库市场规模将达到256.1亿元,增速为34.6%,至2027年市场规模达到441.8亿元。

13.巨杉数据库基于JSON文档型底座对SequoiaDB全面升级

巨杉数据库基于JSON文档型底座对SequoiaDB进行了全面升级,此次发布活动全面解读了SequoiaDB的四大特性——高可用、安全、实时和易用。

巨杉数据库决定将在2024年Q1再次发布开源版本。
另外,SequoiaDB也正在探索,为文档型数据库提Vector Search向量搜索能力,为保存到 SequoiaDB 的向量数据,提供高效的查询能力。

14.Kinetica推出快速准确的自然语言到SQL转换产品

Kinetica,用于分析和生成式AI的实时数据库,推出Quick Start,一种基于大型语言模型(LLM)的解决方案,可在企业数据上将自然语言转换为SQL。
Quick Start旨在支持对实时结构化数据进行临时数据分析,使使用自然语言查询数据既快速又简单。
Quick Start支持将专有数据准确安全地转换为 SQL,从而允许用户使用自然语言询问有关其数据的问题。(dbta.com)

15.阿里云MongoDB 7.0正式发布,带来更加强大、高效、安全的数据库解决方案

1月10日,阿里云MongoDB 7.0版本正式发布,带来了诸多创新功能和显著改进,旨在提升性能、增强数据管理能力,并为开发者提供更丰富、更灵活的工具集。



16.贝格迈思创新产品“AiSQL智能数据库”获得深圳市科创委科技重大专项计划资金支持

近日,贝格迈思(深圳)技术有限公司(贝格迈思)的研发产品“分布式高性能智能数据库AiSQL系统”成功获得深圳市科创委专项资金支持,即深圳市科创委科技重大专项“重202302085面向异构体系结构的分布式高性能智能数据库系统”【深科技创新资〔2023〕92号。
该重大专项是贝格迈思以其核心产品组件为基础,联合深信服、哈工大(深圳)和清华深圳国际研究院共同申报的重大技术攻关项目。该重大专项的成功立项并获得资金支持,标志着贝格迈思的新一代数据库创新产品和研发实力得到了深圳市科创委的高度认可!

数据安全


17.2024年我国数据安全十大发展趋势预测,公共数据安全治理迫在眉睫

数据安全专业厂商明朝万达的专家对数据安全领域未来一年的发展趋势进行了预测,旨在帮助企业更好地应对新的数据相关问题。
01分类分级类产品和服务将爆发式增长
02面向数据交易过程的数据确权与定价的瓶颈,越来越依赖完善体系支撑来实现突破。
03出境数据管控范围逐渐趋于放松,但管控力度在日渐加大
04生成式人工智能应用带来的数据安全问题引发越来越多的关注。
05公共数据安全治理迫在眉睫。
06企业数据安全合规逐步向综合数据安全体系建设过渡。
07数据安全运营指标逐步量化。
08终端安全升级为XDR后更加精准地进行端点保护。
09人工智能与安全技术结合日渐紧密。
10数据安全治理逐渐成为数字经济的基石。

18.大数据的网络安全问题:Apache Hadoop和Flink成为黑客的目标

云原生安全公司Aqua Security Software Ltd.的研究人员发布的一份新报告警告说,针对Apache Hadoop和Flink应用程序出现了一种新攻击。
由于攻击者使用打包程序和rootkit来隐藏其恶意软件,因此该攻击被描述为“特别有趣”。它是研究人员在过去几周内在其云蜜罐中发现的,这些网络旨在吸引和监控网络攻击者,以了解他们的技术并改善防御。
据观察,攻击者利用了Hadoop YARN的ResourceManager 中的错误配置。Hadoop的该组件提供了一个用于管理集群中计算资源的平台。
利用此漏洞,攻击者以 Hadoop YARN为目标,以获得未经身份验证的访问权限以创建和运行应用程序。未经身份验证的远程攻击者可通过专门设计的 HTTP 请求利用错误配置,从而可能导致执行任意代码,具体取决于用户在执行代码的节点上的权限。
同样的蜜罐还检测到对Apache Flink的攻击,Apache Flink是由Apache软件基金会开发的开源、统一的流处理和批处理框架。虽然这是一个不同的漏洞,但攻击者也以与Hadoop攻击类似的方式获得访问权限。(csoonline.com)

19.数据安全厂商云集至宣布完成新一轮战略投资

北京云集至科技有限公司已完成新一轮战略融资,投资方为科创版网络安全上市公司北京信安世纪科技股份有限公司(以下简称“信安世纪”)。本轮投资完成后,双方将进一步在数据安全产业的多个领域开展战略合作。
据了解,云集至是我国数据安全领域一家创新厂商,能够为企业客户提供结构化+非结构化数据安全产品、咨询服务、平台及解决方案。公司在国内较早提出全数据安全理念、技术及产品体系,坚持以“全数据安全为核,安全数据分析为辅”的发展思路,为全数据安全和安全数据分析研发打造丰富产线。
在2022年,云集至公司获得美亚柏科和基石创投的两轮连续融资。此次通过与信安世纪的战略合作,云集至将进一步巩固其在数据安全领域的发展基础,并加速创新和拓展。携手应对日益复杂的数据安全挑战,继续推出更多突破性的产品技术和解决方案,为全行业的数据安全提供更加强有力的保障,推动行业迈向新的发展阶段。

20.Meta发布用于AI安全的开源工具

Meta 推出了Purple Llama,一个致力于为开发人员创建开源工具的项目,用于在生成式 AI 模型公开使用之前对其进行评估和提高可信度和安全性。Purple Llama的目标是为开发更安全的 genAI建立一个共享基础。
通过Purple Llama发布的第一套工具包括CyberSecEval,评估人工智能生成软件中的网络安全风险。它具有一个语言模型,可以识别不适当或有害的文本,包括对暴力或非法活动的讨论。开发人员可以使用 CyberSecEval 来测试他们的AI模型是否容易创建不安全的代码或帮助网络攻击。Meta 的研究发现,大型语言模型通常建议易受攻击的代码,这凸显了持续测试和改进对 AI 安全性的重要性。
Llama Guard是该套件中的另一个工具,这是一个经过训练的大型语言模型,用于识别潜在的有害或冒犯性语言。开发人员可以使用 Llama Guard 来测试他们的模型是否生成或接受不安全的内容,从而帮助过滤掉可能导致不适当输出的提示。可提供快捷的芯片适配服务支持。(infoworld)

AI


21.星环科技凭借Sophon入围Gartner《中国人工智能软件市场指南》

日前,Gartner®发布了《中国人工智能软件市场指南》(Market Guide for AI Software, China)。在中国超3,000名人工智能软件供应商中,Gartner基于其研究团队及客户反馈,将星环科技列为代表供应商。此前,星环科技也曾凭借Sophon入围Gartner发布的《中国分析平台市场指南》(Market Guide for Analytics Platforms, China)。
“2023年,生成式人工智能正在点燃中国人工智能软件市场。” Gartner指出,“据调研数据显示,约有59%的企业计划将增加对生成式人工智能的投入。”为降低客户训练及微调大模型的门槛,星环科技发布了大模型开发和训练工具Sophon LLMOps,为用户打通了从数据接入和开发、提示工程、大模型微调、大模型上架部署到大模型应用编排和业务效果对齐的全链路流程,从而实现针对大模型的“数据和分析的持续提升”。

22.英特尔推出针对英特尔GPU优化的全新低延迟LLM推理解决方案

最近,英特尔研究人员推出了一款全新的LLM推理解决方案,该解决方案为英特尔GPU提供了低延迟和高吞吐量。他们表明,与标准 HuggingFace 实现相比,他们的解决方案实现了高达 7 倍的延迟和高达 27 倍的吞吐量。
随着 LLM 在各行各业继续发挥关键作用,优化其性能已成为一个关键焦点,而英特尔的最新发展有望改变游戏规则。解决LLM固有的复杂性,其特点是复杂的模型结构和自回归推理模式,这一突破背后的团队提出了一种有效的替代方案。
研究团队解决的主要挑战之一是LLM的复杂设计,其特点是复杂的模型结构和广泛的自回归操作。这种复杂性会导致大量内存访问并阻碍推理速度。
简化的 LLM 解码器层是其解决方案的核心,其战略性设计旨在融合数据移动和元素操作。这种融合降低了内存访问频率,并显著降低了系统延迟,为更快、更高效的推理过程铺平了道路。(analyticsindiamag.com)

23.太极股份再次增持人大金仓,加快打造国产数据库“国家队”

太极股份增持人大金仓,持股比例提升至53.3851%,中国电科合计持股比例达到66.2651%。
人大金仓作为数据库领域的“国家队”,深耕数据库技术四十余年,始终秉承“每一行代码皆可掌控”的原则,自主研发的数据库产品已广泛应用于能源、金融、电信、医疗、交通等60余个关键行业,成为数字中国建设的重要支撑底座。
未来,太极股份将持续向人大金仓赋能,夯实其作为国产数据库“国家队”的行业地位,打造其成为世界级数据库产品企业。

24.Ask-AI融资1100万美元,推出“生成式 AI Sidekick”连接50多个工作平台以摄取、分析和理解企业知识

总部位于加拿大的人工智能初创公司 Ask-AI 今天宣布推出其新的“生成式 AI Sidekick”工具,并获得 1100 万美元的融资。
Ask-AI 是一种生成式 AI 解决方案,可提高重复性任务、知识管理和理解客户声音的效率。它可以连接50多个工作平台,包括 Salesforce、Zendesk、Confluence、Jira、Slack、Google Drive 和Teams,以摄取、分析和理解企业知识。
此后,它有助于将这些知识整合到员工的工作流程中,以帮助他们提高工作效率,为客户支持、成功、产品、研发和销售提供多个用例。
据这家初创公司称,如今的公司将数据存储在多个平台和孤岛中:Slack、电子邮件、CRM、业务文档、客户交互、知识库等。在做出决策或与客户互动时获取所有相关数据几乎是不可能的。
生成式AI可以提供帮助,但公司难以构建准确运行、被广泛采用并对业务产生积极影响的解决方案。
这就是 Ask-AI 的用武之地。“ASK”是 Ask-AI 始终在线的“Sidekick”侧边栏,可提供有关团队成员工作流程中任何内容的上下文信息。(mpost.io)



小年纳福
XIAO/NIAN/NA/FU



END




