暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

2022年中国数据库行业年度分析报告:搜索引擎

原创 星环科技 2023-02-23
1353

搜索引擎数据库是一类专门用于数据内容搜索的 NoSQL 数据库,是非结构化大数据处理分析领域中重要的基础支撑软件。近年来,中央出台多项信创相关政策,大力支持信创产业持续发展,努力实现国产替代。数据库作为信息系统的核心和信创基础软件的重要部分,将迎来重大发展机遇。在数据量的爆炸式增长浪潮中,非结构化数据占据了总数据量的大部分,搜索引擎数据库作为非结构化大数据处理分析领域中重要软件,伴随着搜索引擎系统的发展也逐渐发展起来。

2022年11月17日,中国信通院组织召开了“搜索型数据库”技术研讨会,讨论了搜索型数据库的市场前景、技术趋势、应用场景、发展态势等议题,搜索型数据库的数据安全问题日益受到业界的关注,标志着我国对搜索引擎数据库领域的国产替代关注度将逐渐提升。据《东方证券-计算机行业深度报告》预计,搜索引擎数据库未来具有广阔的市场前景,到2025年中国搜索引擎数据库市场将达到32亿元。

图1:东方证券《计算机行业深度报告》搜索引擎数据库发展历程

从全球范围来看,国外搜索引擎数据库发展较早,国外开源产品Elasticsearch 是目前搜索引擎数据库领域的龙头产品,并占据了相当大的市场份额。Elasticsearch在过去几年内,数据泄露事件频发,甚至一个月被曝6次数据泄露。去年,受美国出口管制的巴林,暴露的Elasticsearch集群中近200万条信息被泄露,包含有关人员的敏感信息。而作为美国出口管制重点对象的俄罗斯,近几年发生多起Elasticsearch数据泄露事件。根据Group-IB报告显示,2021年网络上暴露的 Elasticsearch 实例超过10万个,约占2021年暴露数据库总数的30%。Elasticsearch 开源版本是不具备数据保护功能的,看似免费,但不安全。用户必须付费获得Gold+许可才能获得相关的安全保护功能,且不同的安全功能对应不同的收费标准。2021年初, Elastic公司决定将这款开源软件的 Apache License 2.0 变更为双授权许可,即Server Side Public License (SSPL) 和 Elastic License。其核心条款是“如果将程序的功能或修改后的版本作为服务提供给第三方,那么必须免费公开提供服务源代码”。这意味着不法分子可以获得其源代码并研究其漏洞,给企业用户带来巨大的安全风险。

此外,Apache 软件基金会和GitHub官网都有公开说明,产品和技术受到美国的出口法律和法规限制,受美国出口管制的俄罗斯在近期俄乌事件中将这方面风险彻底暴露,警示我们要摆脱被科技制裁风险的唯一出路就是要自主研发,实现真正的自主可控。

国内搜索引擎数据库产品获得关注较少,国产替代产品少,墨天轮排行榜上两大搜索引擎数据库产品 ,星环科技Transwarp Scope和有百度开源的Tera。Transwarp Scope是星环科技自主研发的企业级分布式搜索引擎,通过工信部源代码扫描测试,并于2019年上榜由信息技术应用创新工作委员会编制的国产软硬件技术图谱。Scope可提供PB级海量数据的交互式多维检索分析服务,支持百万级高并发和毫秒级低延时检索业务,覆盖模糊匹配,精确查询,多维检索等各类检索类场景,满足数据检索多样化需求。此外,在国产化生态适配方面,Scope已完成与主流信创生态厂商的适配互认工作,支持适配长城飞腾、华为泰山、龙芯等服务器架构,同时满足麒麟,UOS等操作系统,根据星环科技官方信息显示看,Scope在ROI、扩展性、稳定性、安全性、数据读写/恢复/一致性等全面超越开源Elasticsearch,满足信创要求和国产化替换需求。

IMG_256

图2:Transwarp Scope与Elasticsearch性能对比

最后修改时间:2023-02-23 14:13:35
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论