暂无图片
暂无图片
11
暂无图片
暂无图片
暂无图片

《墨天轮中国数据库流行度排行》得分计算规则说明

原创 墨天轮 2021-12-06
46624

目录导航

墨天轮中国数据库流行度排行于2019年6月推出,通过近50个维度的数据来考察近300个中国数据库的流行度排行,每月1日更新排行数据,用于体现中国数据库在互联网上的流行度。

1、规则说明

我们主要根据如下数据来计算出数据库当月的得分:

1.1、搜索引擎

引入百度、必应、谷歌当月搜索条目数,每个搜索引擎权重不同,如百度、公众号文章较高,最后按整体占比计算得分。

为了数据的准确性,我们会对关键字的搜索结果进行验证,避免分词会加上双引号,如"虚谷数据库"、“偶数科技”。

为了排除关键字为通用英文的问题,如TGDB、CloudTable、TSDB等的搜索关键字改为腾讯云TGDB、华为云CloudTable、阿里云TSDB。

另外我们不提倡非常规手段SEO优化,如批量在非技术论坛发表没有可读性的文章、伪原创等,如发现数据波动异常可能会做降权处理。

1.2、趋势指数

引入微信指数、百度指数、谷歌趋势、360趋势数据,通过搜索数据库关键字得到当月指数或趋势,计算得到每个数据库的平均指数,最后按整体占比计算得分。

  • 微信指数是基于微信大数据的移动端指数产品,能反映关键词在微信内的热度变化。微信指数所反映的热度变化来源于对微信搜索、公众号文章以及朋友圈公开转发文章形成的综合分析。于2022年6月引入。

  • 百度指数是以百度众多网民检索行为数据为基础的数据分享平台。通过百度指数可以研究关键词搜索趋势、洞察网民兴趣和需求、监测舆情动向以及定位受众特征等,是中国互联网行业颇为重要的统计分析平台之一。

  • 谷歌趋势是显示了在不同语言和地区通过谷歌的搜索查询该关键字的频率,通过将关键字的所有兴趣数据除以该日期范围内的最高兴趣点,对结果进行索引并标准化为范围从 0 到 100 的相对值。

  • 360趋势是以360产品海量用户数据为基础的大数据展示平台,可通过搜索关键词,快速获取热度趋势、理解用户真实需求、了解关键字搜索的人群属性。

1.3、资质数量

为了更全面的体现一个数据库产品在技术、市场、生态上的竞争力,和其背后厂商的综合实力,2023年11月将之前三方评测和生态加分项初步整合成20多项资质,这些资质主要来自权威的官方机构、标准机构、分析机构、评测机构、行业协会等有影响力的组织,部分资质也是众多数据库项目招标的门槛,目前包括ISO9001、ISO20000、ISO27001、Gartner魔力象限、Gartner市场份额、IDC中国关系型数据库份额、沙利文数据库市场报告、IDC数据库市场报告、Forrester Wave、CC EALA4+、CCRC EAL4+、分布式数据库金融标准验证、等保测评、ITSS、CMMI5、军B+、GB18030、TPC-C、TPC-H、TPC-DS、GCBS-OLTP测试、软件产品可信、可信数据库评测、国家安全可靠评测,详细参考数据库百科

目前数据库产品统一按每个资质加5分来计算,后期我们也会纳入更多数据库相关的资质并对资质进行分级,让排行体现的维度更完善。

1.4、核心案例数

市场占有率是检验数据库产品最直接也是最有说服力的指标,是客户在选择国产数据库时最重要的参考维度之一。2023年11月将核心系统案例数纳入到排行榜的指标中,核心系统案例数是指国产数据库在金融、运营商、互联网、政企、制造业五个重点行业的核心系统中真实上线且运行中的案例数,让排行与市场更贴合。OA、IT、门户、邮件等非核心系统以及POC测试、项目验证、课题研究等不算在内,且可通过公开渠道查询验证,详细参考数据库案例集,用户可自行提交案例。

案例要求5年内。目前根据案例数整体占比计算得分,后期平台会根据项目规模、业务系统、客户收益、替换难度及项目价值等对案例进行分级,针对新上线的精选案例进行额外加分。

1.5、专利数

专利是自主可控的重要体现,这一指标指厂商在国家或国际平台上可以公开查询的专利数,以体现数据库产品的创新能力。

专利要求5年内。目前主要从国家专利平台获取厂商与数据库相关的专利。

1.6、论文数

论文指厂商在国际数据库顶会、国际论坛、国际期刊发表的论文,以体现厂商在前沿技术、学术领域的成就,具体目录可参考《中国计算机学会推荐国际学术会议和期刊目录(2022)》数据库相关会议和期刊。论文作者需包含厂商人员,或者论文以厂商数据库产品为主体编写。另外,近一年内在VLDB、SIGMOD、ICDE三大顶会上发表论文每篇额外加2分。

论文要求5年内。后期将对国内期刊杂志进行调研,将代表权威学术的论文纳入。

1.7、招聘岗位数

引入51JOB相关招聘数据,根据数据库关键字搜索出每个数据库的岗位数量,体现企业对该数据库人才的需求热度,最后按整体占比计算得分。

1.8、书籍

我们将国产数据库相关书籍整理到墨天轮,统计每个数据库出版的书籍数量,最后按整体占比计算得分。

1.9、 墨天轮内容数量

墨天轮每月统计平台内相关数据库产品被推荐到首页的内容数量,如文章、文档、视频、问答等,平台会根据内容质量、技术含量、文章价值进行推荐,一定声望的用户也可以自荐,单月上限20篇,最后按整体占比计算得分。

2、计算方式及周期

我们会在每月的最后一天自动采集当月的所有相关数据,通过我们的模型和算法多次计算校验,再经过专家组人工审核后,在接下来1号发布数据库当月的得分数据(12月榜单考察11月1日-11月30日的数据,于12月1日发布)。

通过占比得分、降档得分、统一得分等方式单独计算每一项的分数,最后按权重汇总得到某个数据库当月的最终得分,根据分数得到数据库当月的流行度排行。

另外,部分权重会根据数据库行业当月的趋势指数、整体热度动态调整。

3、重要说明

排行榜仅反映该数据库在互联网上的流行度,与产品竞争力、市场份额、技术指标没有直接关系。

排行榜当前采集的数据来源均在互联网上可以公开查询,不涉及到侵犯隐私、数据加工、恶意采集等情况。

我们的初心是为了促进国内数据库技术的创新和推动国产数据库行业的发展,一直在征集各方意见努力改进优化排行榜的算法和模型,希望能够最大限度客观公正展现国产数据库的产业图谱和发展趋势。如果您对国产数据库流行度排行榜有任何建议或者合作机会,欢迎随时联系我们,微信emcs007或邮件contact@modb.pro。

附、FAQ

1、为什么会出现0分的情况?
答复:新加入榜单的数据库、或者存在低于0.01分,另外也存在无法搜索到相关内容的情况。

2、新数据库如何纳入到排行榜?
答复:联系工作人员发送产品白皮书或官方网站即可在下月加入排行榜中。

更多阅读:
《国产数据库排行榜 - 月度解读专题栏目》
《2020年度国产数据库:openGauss》
《墨天轮2021年度数据库获奖名单》
《墨天轮2021年度中国数据库魔力象限》
《墨天轮2022年度数据库获奖名单》
《墨天轮2022年度中国数据库墨力象限》

最后修改时间:2024-05-06 10:18:17
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
1人已赞赏
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论