很多人都在谈论数据的指数增长和如何获得更多的数据。然而,并没有很多人在谈论数据库方面!随着数据的增长,数据库必须要能够跟上。所以,了解如何分析不断增长的数据量,了解如何处理数据的数据库变得越来越重要。DZone编辑团队汇总了51个数据库术语的列表,我们来看一下吧
一个
ACID(原子性,一致性,隔离性,持久性):一个术语,指的是传统上用于SQL数据库的数据库事务的模型属性。
聚合:可以视为单个单元的域对象集群。大型分布式系统上数据存储的理想单元。
Apache Cassandra:一种开源分布式数据库系统,可以跨服务器存储和管理大数据,也可以是大型BI(商业智能)系统的读取密集型数据库。
Apache Lucene:一种开源文本检索库,通常用于全文搜索,实现搜索引擎和实现推荐系统。
Apache Spark:一种开源并行处理框架,可处理大规模数据分析应用程序,实时分析和数据处理工作负载。
乙
BASE(基本可用性,软状态,最终一致性):一个术语,指的是数据库事务的模型属性,特别是需要管理非结构化数据的NoSQL数据库。
B-Tree:一种数据结构,其中所有终端节点距离基站的距离相同,并且所有非终端节点都在n和2n个子树或指针之间。它针对读取和写入大块数据或主要执行读取的系统进行了优化。
C
云原生数据库:在云计算交付模型上构建并运行的数据库。
复杂事件处理:用于从多个流中收集数据以进行分析和规划的组织过程。
一致性:数据库事务的四个主要属性之一,这意味着如果事务失败,数据将返回其原始状态,或者如果数据未失败,则会创建新的数据状态。
d
数据库集群:将两个或多个服务器和实例连接到数据库,通常具有容错,负载平衡和并行处理的优点。
数据沿袭:有关数据来源,变化方式和移动位置的信息; 可用于解决数据库中的验证和调试问题。
数据管理:组织处理数据集存储,处理和分析的完整生命周期。
数据挖掘:在大型数据集中发现模式并将该信息转换为可理解格式的过程。
数据库管理系统(DBMS):一套管理最终用户和数据库之间数据的软件和工具。
数据仓库:一起工作并且似乎作为单个系统运行的各个计算机的集合。这需要访问中央数据库,每台计算机上的数据库的多个副本或每台计算机上的数据库分区。
分布式关系数据库:包含诸如表之类的对象的数据库,这些表是不同但互连的系统的一部分。
分布式系统:一起工作并且似乎作为单个系统工作的各个计算机的集合。这需要访问中央数据库,每台计算机上的数据库的多个副本或每台计算机上的数据库分区。
文档存储:一种数据库,它聚合来自文档而非定义表的数据,用于以可搜索的形式呈现文档数据。
Dynamo DB:来自AWS的NoSQL数据库服务,具有低延迟,可以轻松存储和检索大数据并提供大量流量。
Ë
ElasticSearch:基于Java的搜索引擎,在Apache Lucene下构建,可以近乎实时地搜索和索引文件,并自动索引JSON文档。
最终的一致性:符合BASE模型的数据库将包含随时间变得一致的数据。
F
容错:系统能够在不中断其他系统的情况下响应硬件或软件故障。
G
图形存储:一种用于处理具有大量关系的实体的数据库,例如社交图,标记系统或任何链接丰富的域; 它也经常用于路由和位置服务。
H
Hadoop:专为高可伸缩性,数据密集型分布式计算而开发的Apache Software Foundation框架。它主要用于非常有效地批量处理大型数据集。
高可用性(HA):即使在发生组件故障后,也指计算机系统中资源的持续可用性。这可以通过冗余硬件,软件解决方案和其他特定策略来实现。
混合事务/分析处理:一种应用程序体系结构,据说可以在事务处理和分析之间“突破”并实现实时决策。
一世
内存:作为一个通用的行业术语,它描述了将数据加载到RAM或闪存而不是硬盘或固态驱动器的数据管理工具。
Ĵ
Join:SQL中的一个子句,它使用每个表的公共值组合关系数据库中一个或多个表的列。
日记:指同时,实时记录数据库中的所有数据更新。生成的日志用作审计跟踪,如果原始数据已损坏或已删除,则可用于重建数据库。
JPA(Java持久性API):用于在Java对象/类和关系数据库之间访问,管理和保存数据的Java规范。
ķ
键值存储:一种将数据存储在简单键值对中的数据库。它们用于处理大量小型,连续且可能易失性的读写操作。
大号
闪电内存映射数据库(LMDB):一种写时复制B-Tree数据库,完全事务性,符合ACID,体积小,并使用MVCC。
日志结构合并(LSM)树:使用通常组织为级别的不可变段或运行来编写和编辑数据的数据结构。有几种策略,但第一级通常包含最新和活动的数据。
中号
MapReduce:由Google创建的编程模型,用于在多个集群上实现高可伸缩性和分布,以实现数据处理。
多版本并发控制(MVCC):一种处理机器同时读写数据库的情况的方法。
ñ
非第一范式查询语言(N1QL):由Couchbase开发,为分布式面向文档的数据库提供通用查询语言和基于JSON的数据模型。
NewSQL:关系数据库系统的简写描述符,提供与NoSQL系统同等的水平可伸缩性和性能。
NoSQL:一类数据库系统,它结合了传统SQL之外的其他查询方式,并且不使用标准关系结构。
Ø
对象关系映射器(ORM):一种工具,它提供数据库抽象层,使用面向对象的编程语言而不是数据库的查询语言在不兼容的类型系统之间转换数据。
P
并行性:操作系统能够有效协同解决问题的状态。
持久性:指程序中的信息超过创建它的过程,这意味着它在关闭或清除RAM时不会被擦除。数据库提供持久性。
多语言持久性:指组织对不同类型的数据使用多种不同的数据存储技术。
[R
关系数据库:构建表,记录和列中相互关联的数据集的数据库。
复制:共享数据的术语,以确保冗余资源之间的一致性。
小号
可伸缩性:数据库或其他系统能够承担更多资源和容量以及连接多个实体以提高效率的能力,
架构:单个数据库的唯一数据结构的术语。
拆分:也称为“水平分区,”分片是其中一个数据库被分成几个块,通常是提高应用程序的速度和可靠性。
强一致性:一种数据库概念,指的是无法提交违反数据库数据有效性规则的事务。
结构化查询语言(SQL):一种用于管理和操作数据的编程语言; 主要用于关系数据库。
w ^
宽列存储:由于它们与Google的早期BigTable数据库的关系,也称为“BigTable存储”,这些数据库将数据存储在可容纳大量动态列的记录中。列名和记录键不是固定的。