
新闻速递

1.海量存储、高效压缩、实时分析,星环科技推出分布式时序数据库TimeLyre 9.1
2.哪种数据库全球增长最快?时序数据库爆了!下一个独角兽是拿来的开源还是大投入的“自研”系统?
3.《数据库发展研究报告(2023年)》:时序数据库53个,在非关系数据库中占比15.4%
大数据
4.中国电子技术标准化研究院发布《知识图谱与大模型融合实践研究报告》
5.五项技术代表厂商,星环科技入围Gartner®《2023年中国数据、分析及人工智能技术成熟度曲线》
6.浪潮发布分布式多模数据库KaiwuDB,助力企业构建数据管理坚实基座
7.腾讯云大数据ES Serverless服务开启日志分析新体验
8.Cloudera董事会任命Charles Sansbury为新任首席执行官
9.Amazon QuickSight推出生成式BI功能,升级自然语言人机交互
10.Elastic可观测解决方案为集成插件启用时序数据流,可节省高达 70% 的指标存储空间
数据库
11.Ontotext 在 GraphDB 10.3 中引入了 ChatGPT 功能
12.海东青时序数据库发布2.1.0版本
13.悦数图数据库发布AI大模型解决方案,开启「图+ 大模型」应用新范式
数据安全
14.中国信通院发布了“2023隐私计算行业观察”
15.Elastic Security 8.8:强大的端点响应、警报分类和数据准确性可提高安全效率
16.Ermetic 创建用于评估多云安全性的开源项目
AI
17.中国电子技术标准化研究院发布《知识图谱互联互通白皮书》
18.OpenAI即将推出开源GPT模型
19.Amazon CodeWhisperer与Amazon Glue集成,借助生成式AI进一步提升开发效率
20.开箱即用的UCloud大模型一体机,助力垂直大模型私有化交付
21.元象开源百亿参数多语言大模型
22.Meta发布开源AI工具AudioCraft,可帮助用户创作音乐和音频
23.弘玑完成约4000万美元C+轮融资:加速新一代企业级产品AIGA的研发落地
本周热点
1.海量存储、高效压缩、实时分析,星环科技推出分布式时序数据库TimeLyre 9.1

Transwarp TimeLyre是星环科技自主研发的企业级分布式时序数据库,其支持分布式水平扩展,同时具有极高的压缩率可以支持海量时序数据的存储,提供高吞吐实时写入、时序精确查询、多维检索等功能,可以有效支撑物联网、能源制造、金融量化交易领域等多种时序数据业务场景。
近日,TimeLyre正式发布V9.1版本,通过原生分布式架构、5-20倍无损数据压缩能力、每秒千万级数据吞吐能力、优异的查询分析性能、丰富的生态支持、灵活的部署方式,为海量时序数据的高效存储、快速查询、便捷计算提供了有力支撑,大幅降低了企业硬件成本,保障了时序数据查询分析的实效性,满足了时序数据在各类复杂业务场景的应用需求。同时新版本还提供一站式国产化替代解决方案,可以实现InfluxDB的平滑替换,助力企业打造自主可控数据平台。
2.哪种数据库全球增长最快?时序数据库爆了!下一个独角兽是拿来的开源还是大投入的“自研”系统?

全球增长最快的数据库是哪一种?DB-Engines的数据显示,时序数据库,超过了备受关注的键值数据库、图数据库、时空数据库等,成为目前增长最快的数据库类型。
在可预知的未来3~5年,随着物联网以及工业4.0的到来,所有设备都会携带传感器并联网,传感器收集的时序数据将严重依赖时序数据库的实时分析能力、存储能力以及查询统计能力。

在时序数据库市场,相对于开源系统,自主研发的系统表现出更强的竞争力。国内自研的时序数据库正开始替代国外的开源系统,实现时序数据库库的国产化替代。
3.《数据库发展研究报告(2023年)》:时序数据库53个,在非关系数据库中占比15.4%

报告显示,2022年全球数据库市场规模为833亿美元,中国数据库市场规模为59.7亿美元(约合403.6亿元人民币),占全球7.2%。预计到2027年,中国数据库市场总规模将达到1286.8亿元,市场年复合增长率(CAGR)为26.1%。2022年,公有云数据库市场规模为219.15亿元占市场总体的54.3%,较2021年增速51.6%,我国公有云数据库市场规模首次过半。
我国数据库产品数量呈现以关系型为主,非关系型数据库为辅的局面。关系型数据库156个,非关系型数据库有82个,占比分别为65.5%和34.5%。非关系型数据库中,图数据库24个、时序数据库24个、键值数据库10个、列存数据库10个,在非关系数据库中依次占比29.3%、29.3%、12.2%和12.2%。

大数据
4.中国电子技术标准化研究院发布《知识图谱与大模型融合实践研究报告》

《知识图谱与大模型融合实践研究报告》(2023年版)发布仪式,该白皮书是由中国电子技术标准化研究院依托知识图谱产业推进方阵、全国信标委人工智能分委会知识图谱工作组联合32家企事业单位、高校和研究院所共同编制。
研究报告从知识图谱与大模型落地面临的瓶颈出发,分析了知识图谱与大模型的主要特征、知识图谱与大模型擅长的主要场景和核心基础能力,对比了知识图谱与大模型的优劣势,进而从技术演化层面、技术互补层面、知识库建设层面探讨了知识图谱与大模型融合的可行性及收益。
同时,研究报告分析了知识图谱与大模型融合的技术路径及其关键技术,研究了知识图谱与大模型融合系统评测体系,对比了实际融合系统与大模型的性能测试结果。最终,通过梳理已有11个领域的实践案例,给出了技术挑战与发展展望。
5.五项技术代表厂商,星环科技入围Gartner®《2023年中国数据、分析及人工智能技术成熟度曲线》

7月17日,Gartner发布了《2023年中国数据、分析及人工智能技术成熟度曲线》(即《Hype Cycle for Data, Analytics and AI in China, 2023》)报告,星环科技能够同时在数据共享、湖仓一体、自主研发、知识图谱和数据科学平民化(即Data Sharing, Lakehouse, DBMS Self-Sufficiency,Knowledge Graphs, Citizen Data Science)5项技术领域入选代表供应商,凭借的是其覆盖数据全生命周期的基础软件产品。
此前,星环科技曾入围Gartner《2022年分析与商业智能技术成熟度曲线报告》(即《Hype Cycle for Analytics and Business Intelligence, 2022》Jul.2022)、《图数据库管理系统市场指南》(即《Market Guide for Graph Database Management Systems》Aug.2022),被列为数据中台和图数据库的全球代表供应商。此次在5种技术领域的同时入围,充分体现了星环科技在数据分析和人工智能领域的技术优势和独特价值。
6.浪潮发布分布式多模数据库KaiwuDB,助力企业构建数据管理坚实基座

为助力企业客户搭建数据管理的坚实基座,浪潮依托创新研发的“就地计算”技术,并在智能预计算、多模架构等技术上实现突破,正式推出分布式多模数据库KaiwuDB,面向物联网及各大行业领域提供覆盖全生命周期的数据管理及服务,帮助企业解决在数据存储、管理、分析中遇到的瓶颈,激活数据价值,赋能企业数字能力建设。
作为一款融合了分布式数据库及多模数据库特点的数据库产品,KaiwuDB具备分布式数据库的强一致、高可用架构,以及水平扩展能力、高性能、企业级安全等特性。产品还兼备多模数据库支持时序、结构化、半结构化和非结构化数据统一汇聚存储、管理及分析的特性,做到“快人一步”,从容应对物联网时代多源异构数据的管理需求,已应用于工业物联网、数字能源、车联网、智慧矿山、智慧园区等快速发展的重要领域。
7.腾讯云大数据ES Serverless服务开启日志分析新体验

腾讯云大数据 ES Serverless服务重磅发布,拥有自动弹性、完全免运维、极致成本、Elastic Stack生态兼容、灵活易用、稳定可靠等优势特性,提供开箱即用的云端Elasticsearch体验,助力企业高效上云!
从产品架构上,面向日志场景,ES Serverless服务提供自动弹性、完全免运维的一站式日志分析解决方案,在使用时,用户仅需关注数据源以及检索分析等业务逻辑即可,中间的流量调度、链路调度以及资源调度全部由 ES Serverless服务完成,不需要再关注底层的数据链路、消息队列、集群运维以及索引配置等等,平台提供端到端的SLA保障。
除了支持原生的ES API写入方式之外,控制台已支持云服务器CVM、容器服务TKE、云数据仓库Clickhouse的一站式数据采集分析,同时也支持通过Logstash、Flink以及Kafka等将数据投到ES Serverless服务的索引中。
8.Cloudera董事会任命Charles Sansbury为新任首席执行官

可信企业AI数据公司肯睿Cloudera 8月7日宣布任命Charles Sansbury为首席执行官。
Sansbury表示:“感谢董事会委托我领导Cloudera,我很高兴有机会带领公司进入一个新的发展阶段,成为一家可信企业AI公司。Cloudera团队的素质、顶尖的客户及其在提供关键企业AI功能方面的技术领先优势吸引了我。Cloudera管理着超过2500万TB的数据,为许多财富1000强企业提供指导,这些企业专注于实施开放式湖仓一体,以此扩大AI和机器学习应用。我相信Cloudera将继续巩固产品领先优势和增长计划。”
9.Amazon QuickSight推出生成式BI功能,升级自然语言人机交互

亚马逊云科技宣布,将Amazon Bedrock提供的大语言模型能力与支持自然语言问答的Amazon QuickSight Q相结合,在Amazon QuickSight中提供生成式BI功能。该功能很快将在Amazon QuickSight上线,帮助企业轻松探索数据、发现并分享洞察。
借助Amazon QuickSight中新增的生成式BI功能,业务分析师能够使用自然语言轻松执行日常任务,包括:
· 基于Amazon QuickSight Q全新的视觉创作体验功能,在几秒钟内创建数据可视化图表;
· 使用自然语言微调和格式化图表效果;
· 无需学习特定语法,通过自然语言即可创建计算任务。
针对使用仪表盘并需要与之进行交互的业务用户,亚马逊云科技还发布了Stories功能,助力业务用户使用生成式BI的强大能力,通过自然语言提示来生成、定制和共享极具信息量的可视化图表。
10.Elastic可观测解决方案为集成插件启用时序数据流,可节省高达 70% 的指标存储空间

Elastic 可观测解决方案里面一些最常用的集成插件在最新版本里面默认使用更加经济高效的时间序列索引来存储指标数据。Kubernetes、Nginx、System、AWS、Azure、RabbitMQ、Redis 和更多的常用 Elastic 可观测集成插件开始支持时间序列数据流 (TSDS)。
Elastic在 8.7 中正式GA发布了时间序列数据流功能。Elastic时间序列数据流 (TSDS) 将指标存储在针对时间序列数据库 ( TSDB ) 优化的索引中,这种类型的索引经过优化以存储时间序列指标。Elastic 在 8.7 中还通过一些功能进行了重大优化,将指标的存储成本降低了 70% 左右。
在 8.9 版本发布时,多达 40% 的 Elastic 集成插件都发布了开箱即用的时间序列索引模式版本。
当使用启用 TSDS 版本的集成插件时,您可以实现以下优势:
·磁盘空间减少高达 70%:通过在集成插件中无缝启用 TSDS,您的指标数据磁盘存储空间可显著减少 70%。这种减少意味着成本节约和基础设施可扩展性的提高。
·简化的数据管理:TSDS 简化了带时间戳的指标数据的存储和检索,使您可以轻松组织和分析有价值的数据。
·开箱即用的功能:由于和 TSDS 的原生集成,您可以利用其强大的功能,而无需任何用户输入或额外的配置。该集成无缝优化了指标数据的存储效率,使您能够专注于获取有意义的洞察。
数据库
11.Ontotext 在 GraphDB 10.3 中引入了 ChatGPT 功能

Ontotext正在发布GraphDB 10.3,引入了新功能,例如集成ChatGPT,一种流行的大型语言模型(LLM),极大地帮助用户理解SPARQL查询和结果,同时还提供了一种新的机制来丰富RDF数据。
,GraphDB现在提供了直接从SPARQL向ChatGPT提出一般性问题的能力。通过这样做,用户可以丰富他们的图表并从他们的数据中提取其他信息。
此外,据该公司称,将强大的数据虚拟化解决方案Ontop升级到版本5,通过引入新功能和对其他数据源的支持,大大减少了从现有数据源构建知识图谱所需的时间和精力。
Elasticsearch和Solr连接器的升级版本,以及新的专用OpenSearch连接器,为用户提供了更好的数据索引和搜索灵活性。
12.海东青时序数据库发布2.1.0版本

海东青 FalconTSDB于7月28日迎来了v2.1.0版本的正式发布!v2.1.0版本相较于v2.0.0版本有了更大的改进,主要体现在SQL表达能力的进一步提升,以及实现了独立的优化器和完善了并行查询,使得数据分析变得更加快速。
海东青时序数据库是一款高性能的支持跨平台、国产化、主从高可用、SQL(兼容MySQL和InfluxDB)的时序数据库。它专门针对大量时序数据的场景实现列式存储物理引擎,提供高压缩比的低成本存储、高效的数据写入和查询服务。
13.悦数图数据库发布AI大模型解决方案,开启「图+ 大模型」应用新范式

国产企业级分布式图数据库——悦数图数据库正式发布了图+ AI 大模型解决方案,率先实现了基于自然语言的知识图谱构建&查询(Text2Cypher)技术方案,为用户提供了强大的数据管理、语义理解和信息提取能力,让企业以更低成本实现更高性能的行业大模型应用,同时人机交互的问答结果更智能、更精准。
作为国内首家引入了 LangChain 的图数据库厂商,悦数图数据库率先实现了基于 Knowledge Graph+Vector DB 的 Graph In-Context Learning方案。同时,悦数图数据库正致力于将 “GraphStore” 存储上下文引入 Llama Index,从而引入知识图谱的外部存储,全面打造更高效易用的「图+ LLM」 解决方案。
在交互方式方面,悦数图数据库已经实现了基于「Graph + LLM」 技术的 Text2Cypher,即自然语言生成图查询。用户只需要在对话界面中通过自然语言就可以轻松实现知识图谱的构建和查询,更有开箱即用的企业级服务,企业用户可以使用悦数图数据库导入海量行业数据,快速构建行业专属知识图谱。基于悦数图数据库提供的强大查询能力和性能,用户不仅可以以较低的费用成本完成高准确性的查找和直观的可视化呈现,而且能直接使用自然语言进行交互式提问和查询,大幅度降低企业使用门槛。
数据安全
14.中国信通院发布了“2023隐私计算行业观察”

中国信通院云计算与大数据研究所副主任闫树正式发布了“2023隐私计算行业观察“,从政策、市场、技术等角度总结了隐私计算现状,并针对当前发展挑战与热点现象带来思考和观察。
观点一:市场需求快速增长,产业处于稳步上升阶段
观点二:开源提供新动能,持续助力生态繁荣
观点三:产品能力稳步提升,已具备大规模应用基础
观点四:AIGC带来数据流通新模式
观点五:大模型带来隐私计算发展新机遇
观点六:尝试技术手段度量“匿名化程度”推进合规性验证
观点七:通过隐私工程完善企业隐私保护合规要求
观点八:多技术融合助力突破应用瓶颈
观点九:公共数据授权运营为隐私计算提供新场景
观点十:通过互联互通助推构建广泛生态圈
15.Elastic Security 8.8:强大的端点响应、警报分类和数据准确性可提高安全效率

随着网络威胁的数量和复杂性不断增加,安全分析师面临越来越大的压力,需要以最大效率保护其组织免受攻击。Elastic Security 8.8引入了旨在帮助分析师消化、确定优先级并快速响应安全事件的功能。这些功能包括:
改进的警报分类体验,通过可自定义的控件和多字段分组,使安全分析师能够对警报进行分类和组织,以确保他们能够快速解决最关键的问题。
新的执行命令功能使分析师能够有效地在远程灵活诊断和修复主机上的安全问题,而无需在物理上访问设备。
使用新的数据质量仪表板快速识别和解决数据质量问题,确保数据准确、完整和最新。
8.8版本中,我们发布云原生漏洞管理功能的测试版,可以快速识别和纠正云环境中的漏洞,并提供容器工作负载保护(CWP),以为容器化环境提供应用程序和数据安全保障。
Elastic Security 8.8可在Elastic Cloud上使用——这是唯一包含此最新版本中所有新功能的托管Elasticsearch产品。您还可以下载Elastic Stack和我们的云编排产品Elastic Cloud Enterprise和Elastic Cloud for Kubernetes,以获得自我管理的体验。
16.Ermetic 创建用于评估多云安全性的开源项目

云基础设施安全公司Ermetic推出一个开源项目CNAPPgoat,允许组织在交互式沙盒环境中安全地测试其云安全技能,流程,工具和态势。
CNAPPgoat 支持 AWS、Azure 和 GCP 平台,用于评估云原生应用程序保护平台 (CNAPP) 中包含的安全功能。
AI
17.中国电子技术标准化研究院发布《知识图谱互联互通白皮书》

《知识图谱互联互通白皮书》(2023年版)于第三届知识图谱产业发展论坛暨知识图谱与大模型融合研讨会正式发布。
《知识图谱互联互通白皮书》(2023年版)由中国电子技术标准化研究院依托知识图谱产业推进方阵、全国信标委人工智能分委会知识图谱工作组联合51家企事业单位、高校和研究院所共同编制。
白皮书从技术、产业、政策等层面的核心需求出发,详细分析了知识图谱互联互通的内涵与外延、任务与约束、典型应用场景和实践案例,并明确了开展和实施过程中面临的难点与挑战。此后,进一步提出了知识图谱互联互通的统一架构、面向知识图谱互联互通的知识表示框架、本体模型注册流程、知识融合与计算流程,并从技术发展、政策支持、标准化需求、产业推广措施等方面给出了展望与建议。
目前,中国电子技术标准化研究院已联合多家单位共同建立知识图谱产业推进方阵、全国信标委人工智能分委会知识图谱工作组,牵头研制国家标准GB/T 42131-2022《人工智能 知识图谱技术框架》、IEEE Std 2807:2022《Framework of Knowledge Graphs》等IEEE P2807知识图谱系列标准及团体标准共10余项,并由我院专家担任ISO/IEC DIS 5392《信息技术 人工智能 知识工程参考架构》国际标准项目的编辑。
18.OpenAI即将推出开源GPT模型

OpenAI准备在AI世界中投下重磅炸弹,并暗示将其GPT模型作为开源发布。
开源GPT模型很可能意味着OpenAI正在回归其作为非营利性开源公司的根源。随着最初的创始成员之一Andrej Karpathy积极为开源社区做出贡献,这种发展变得更加可观。
截至目前,OpenAI在媒体上没有关于这种嗡嗡声的官方台词。然而,随着Karpathy的暗示和正在进行的LLM实验,人工智能世界急切地等待着OpenAI的下一步行动。
19.Amazon CodeWhisperer与Amazon Glue集成,借助生成式AI进一步提升开发效率

亚马逊云科技宣布了Amazon CodeWhisperer正式可用。这是一款AI编程助手,能够使用底层基础模型帮助开发人员提高工作效率。它可以根据开发人员使用自然语言留下的注释和IDE(集成开发环境)中的历史代码实时生成代码建议。
此外,亚马逊云科技还发布了Amazon CodeWhisperer Jupyter扩展程序,为Jupyter用户在Jupyter Lab和Amazon SageMaker Studio中的Python notebook生成实时、单行或完整的函数代码建议。
现在,亚马逊云科技正式宣布Amazon CodeWhisperer为Amazon Glue Studio notebook提供支持,帮助Amazon Glue用户优化使用体验、提高开发效率。通过Amazon Glue Studio notebook,开发人员可以用自然语言(英语)编写特定任务,比如“利用json文件中的内容创建一个Spark DataFrame”。基于此信息,Amazon CodeWhisperer会直接在notebook中推荐一个或多个可完成此任务的代码片段。开发人员可以选择“接受最推荐的建议”,“查看更多建议”或“继续自己编写代码”。
Amazon Glue Studio notebook与Amazon CodeWhisperer之间的集成可以帮助用户更快开展数据集成工作。该集成目前已在美国东部(北弗吉尼亚州)可用。用户现在就可以着手将Amazon Glue Studio notebook与Amazon CodeWhisper进行集成,以加快数据集成构建工作。
20.开箱即用的UCloud大模型一体机,助力垂直大模型私有化交付

面向政府、金融、教育、制造、基金等行业客户及大模型企业的大模型私有化交付场景,优刻得推出国内第一款私有化大模型一体机,内置优刻得自主研发的全栈私有云平台,结合行业垂直大模型一体化交付给客户,用户可在企业内部一键部署大模型应用,安全便捷的提供AI训练和推理等服务。
为实现大模型私有化交付,优刻得大模型一体机,基于一云多芯且自主可控的UCloudStack全栈私有云平台,提供虚拟化、存储、网络及MaaS模型的私有化一体交付方案,支持Alpaca-LoRA、ChatGLM、T5、MiniGPT-4、Stable Diffusion、LLaMA2及Milvus向量数据库等开源模型的部署及算力调度,用户可在本地或自有数据中心内,轻松部署针对特定场景的大模型服务。

元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。
据介绍,XVERSE-13B是一个通用大模型,基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。
XVERSE-13B具备了高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署和使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。
22.Meta发布开源AI工具AudioCraft,可帮助用户创作音乐和音频

Meta发布了一款开源人工智能(AI)工具AudioCraft,该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
23.弘玑完成约4000万美元C+轮融资:加速新一代企业级产品AIGA的研发落地

弘玑于今年7月完成约4000万美元的C+轮融资,结合其在2021年完成的1.5亿美金C轮融资,累计近两亿美金融资,创下同行业最高融资规模纪录。C+轮由华兴资本担任独家财务顾问。
本轮融资资金将主要用于AIGA(AI Generated Automation 即生成式自动化 )企业级产品的研发落地、行业资源整合与市场拓展。
成立于2015年的弘玑作为一家AI企业级应用服务商,基于自身的技术实力和丰富的应用场景,根据企业级客户的真实需求,持续巩固并迭代超级自动化的产品矩阵,与500强等大中型企业合作打磨出以AI赋能的RPA(数字员工)+CoE(数字员工管理平台)+Process Intelligence(流程挖掘)的行业解决方案。

春华秋实!

扫码关注
大数据应用
从现在开始

End




