
想学会更多实用技巧,欢迎加入青学会MOP技术社区(实名社区)。
加入方法:公众号后台回复关键字“加入”获取小助手微信,添加后登记入会。

同时欢迎大家在评论区留言互动交流!社区会不定期举行相关的抽奖、公开分享活动。
如果你有想了解的知识点希望我们发文可以后台私信。
最近联合几个 Oracle ACE技术专家 开通了一个付费微信群,都是具有10多年金融、医疗、制造业10年以上的一线专家,坑位费399/人,无限期,目前群内近135人。加群后会有一些福利(分享各类技术文档,干货资源,问题解答等等),更有特邀嘉宾会定期在群内直播,解读AWR,快问快答等!有问题我们尽量都解答,毕竟399不能都解决所有问题。有兴趣联系微:ywu0613
内部知识库正在筹建中,不止有oracle!

正文开始

老铁们,是不是刚接触数据库领域时,面对一堆专业术语感到头大?别担心!今天就给大家整理了数据库行业的 50 个常见术语,涵盖了技术概念、工具和行业实践,帮你轻松入门,快速成为数据库小能手!无论是学习 Oracle 数据库运维,还是探索其他数据库技术,这些术语都是你的必备 “宝典”。话不多说,赶紧上车!
核心概念
ACID :事务四特性,就像是数据库里的 “四大金刚”,保证数据操作的可靠性。原子性(Atomicity)就像一个完整的任务,要么全做,要么全不做;一致性(Consistency)确保数据从一个正确状态到另一个正确状态;隔离性(Isolation)让不同事务互不干扰;持久性(Durability)保证数据一旦提交就永久保存。 CAP 定理 :在分布式系统里,一致性(Consistency)、可用性(Availability)、分区容忍性(Partition Tolerance)就像 “三座大山”,很难同时兼得。就像你在网上购物,系统要么保证数据一致(比如库存准确),要么保证服务可用(能正常下单),但在网络分区(比如部分地区网络故障)时,往往难以两全。 BASE :弱一致性模型,Basically Available(基本可用)、Soft state(软状态)、Eventually consistent(最终一致)。可以理解为,系统在某些情况下允许短暂的不一致,但最终会达到一致状态。就像你和朋友约吃饭,可能一开始时间没对上,但最后还是会碰面。 OLTP :联机事务处理,是数据库里的 “短跑健将”,处理高并发的短事务,比如银行转账、电商下单等。它追求快速响应,保证每一笔交易都能及时准确地完成。 OLAP :联机分析处理,是数据库里的 “数据分析专家”,擅长处理复杂查询和报表。它能从海量数据中挖掘出有价值的信息,帮助企业做决策,比如分析销售数据、用户行为等。 ETL :数据抽取、转换、加载流程,就像数据库里的 “搬运工”,把数据从一个地方搬到另一个地方,并进行清洗、转换等操作,让数据变得更有价值。 DDL :数据定义语言,是数据库里的 “建筑师”,负责创建、修改和删除数据库结构,比如 CREATE TABLE
就是用来创建表的。DML :数据操作语言,是数据库里的 “操作员”,负责对数据进行增、删、改、查操作,比如 INSERT
添加数据,UPDATE
修改数据。DCL :数据控制语言,是数据库里的 “保安”,负责管理权限,比如谁可以访问哪些数据,谁可以对数据进行什么操作。 ORM :对象关系映射,就像数据库和编程语言之间的 “翻译官”,把编程语言里的对象和数据库里的表对应起来,让开发更方便。
数据库类型
RDBMS :关系型数据库,是数据库里的 “老牌劲旅”,以表格形式存储数据,通过行和列建立关系,比如 MySQL、PostgreSQL。它结构清晰,适合处理复杂查询和事务。 NoSQL :非关系型数据库,是数据库里的 “新兴势力”,不拘泥于表格结构,有键值对、文档、列族、图等多种存储方式,比如 MongoDB、Cassandra。它灵活扩展,适合处理海量数据和高并发场景。 NewSQL :兼具关系模型与分布式能力的数据库,就像数据库里的 “全能选手”,既有关系型数据库的结构优势,又有分布式数据库的扩展能力,比如 TiDB。它既能处理复杂查询,又能应对大规模数据存储和高并发访问。 Time-Series DB :时序数据库,是数据库里的 “时间记录者”,专门用来存储时间序列数据,比如物联网设备的传感器数据、股票行情数据等。它能高效地处理和分析时间相关的数据。 Graph DB :图数据库,是数据库里的 “关系网专家”,以图的形式存储数据,节点代表实体,边代表关系,比如 Neo4j。它在处理复杂关系数据时表现出色,比如社交网络、知识图谱等。 Vector DB :向量数据库,是数据库里的 “AI 助手”,用于 AI 向量检索,比如 Pinecone。它能快速地在高维向量空间中进行相似度搜索,为 AI 应用提供支持。 In-Memory DB :内存数据库,是数据库里的 “飞毛腿”,数据存储在内存中,读写速度极快,比如 Redis。它适合对实时性要求高的场景,比如缓存、消息队列等。
分布式与高可用
Sharding :分片,就像把一个大数据库拆成多个小块,每个小块存储一部分数据,实现水平扩展。这样可以提高数据库的性能和容量,就像把一个大超市分成多个小分店,方便顾客购物。 Replication :主从复制,是数据库里的 “备份小能手”,主节点负责写数据,从节点复制主节点的数据,实现数据冗余和负载均衡。如果主节点出现问题,从节点可以迅速接替工作。 Consensus :共识算法,是分布式系统里的 “裁判”,确保多个节点在数据更新时达成一致。常见的有 Raft、Paxos 等算法,它们就像一群裁判在商量如何判定比赛结果,保证比赛的公平性。 Gossip 协议 :节点间状态传播协议,Cassandra 就使用这种协议。它就像一群八卦的人在互相传递消息,让每个节点都知道其他节点的状态。 Quorum :分布式写入 / 读取的法定人数机制,就像开会表决时需要达到一定人数才能通过决议。在数据库里,写入或读取数据时需要满足一定的节点数量要求,以保证数据的一致性和可靠性。 Hot Standby :热备节点,是数据库里的 “替补队员”,实时同步主节点数据,随时准备接替主节点工作。一旦主节点出现故障,热备节点能迅速上线,保证服务不中断。 Multi-AZ :多可用区部署,是云数据库里的 “多地备份” 方案,把数据库部署在多个可用区,每个可用区都有独立的硬件和网络设施。这样可以提高数据库的可用性和容灾能力,即使一个可用区出现问题,其他可用区也能继续提供服务。
性能优化
Indexing :索引,就像数据库里的 “目录”,能快速定位到所需数据,提高查询速度。比如在书里查找某个知识点,通过目录就能快速找到对应的页码。 Query Plan :查询执行计划优化,是数据库里的 “导航仪”,帮助数据库选择最优的查询路径,提高查询效率。它会根据数据分布、索引情况等因素,为查询语句制定最佳执行方案。 Deadlock :死锁,是数据库里的 “交通堵塞”,两个或多个事务相互等待对方释放资源,导致无法继续执行。就像两辆车在路口互相挡路,谁也走不了。 Connection Pool :连接池,是数据库里的 “连接仓库”,提前创建好一组数据库连接,供应用程序复用,避免频繁创建和销毁连接的开销。就像一个公司里的会议室,提前预订好,大家就可以随时使用,不用每次都重新安排。 WAL :预写日志(Write-Ahead Logging),是数据库里的 “记账本”,在数据写入磁盘之前先写入日志,保障数据的持久性。即使数据库出现故障,也可以通过日志恢复数据。 MVCC :多版本并发控制,是数据库里的 “时间机器”,为每个事务提供一个独立的视图,避免读写冲突。它允许不同事务看到不同版本的数据,就像每个人都有自己专属的时间线。
数据存储结构
B-Tree :平衡树结构,是数据库里的 “数据索引树”,常见于索引实现。它能快速地在数据中进行查找、插入和删除操作,保持数据的有序性。 LSM-Tree :日志结构合并树,是数据库里的 “数据存储新宠”,LevelDB、RocksDB 等数据库使用这种结构。它先将数据写入内存中的日志,然后再定期合并到磁盘,具有写入速度快、读取效率高的特点。 Columnar Storage :列式存储,是数据库里的 “数据存储专家”,把数据按列存储,适合大数据分析和报表查询。比如 Parquet 格式,它能高效地压缩和扫描数据,提高查询性能。 JSONB :二进制 JSON,是 PostgreSQL 里的 “数据存储优化格式”,能更高效地存储和查询 JSON 数据。它将 JSON 数据以二进制形式存储,减少存储空间,提高查询速度。 Hadoop HDFS :分布式文件系统,是大数据存储的 “基石”,为 Hadoop 生态系统提供高可靠、高扩展的存储服务。它把数据分散存储在多个节点上,实现数据冗余和负载均衡。
云与运维
DBaaS :数据库即服务,是云数据库里的 “一站式解决方案”,比如 AWS RDS。用户无需自己搭建和维护数据库,只需通过云平台即可使用数据库服务,省时省力。 Aurora :AWS 云原生关系数据库,是数据库里的 “云上明星”,具有高性能、高可用、自动扩展等特点。它结合了传统关系型数据库的优势和云原生技术,为用户提供更好的数据库体验。 Multi-Tenancy :多租户架构,是数据库里的 “共享公寓”,多个租户共享一个数据库实例,但每个租户都有自己独立的数据和配置。这样可以提高资源利用率,降低运维成本。 Backup Snapshot :数据库快照备份,是数据库里的 “时光快照”,能快速创建数据库在某一时刻的状态副本,用于数据恢复和备份。就像给数据库拍一张照片,随时可以回溯到那个时刻。 Point-in-Time Recovery :按时间点恢复数据,是数据库里的 “时光倒流术”,可以根据备份和日志将数据库恢复到指定时间点的状态。即使数据被误删或损坏,也能轻松恢复。
数据仓库与大数据
Data Lake :数据湖,是大数据存储的 “大水库”,存储原始非结构化数据,比如文本、图片、视频等。它能容纳各种类型的数据,为后续的数据分析和挖掘提供丰富的资源。 Data Mart :数据集市,是数据仓库里的 “小超市”,是部门级数据仓库的子集,专注于特定业务领域的数据。它能快速为特定部门或团队提供数据支持,满足他们的分析需求。 Star Schema :星型模型,是数据仓库里的 “数据结构明星”,以事实表为中心,周围围绕着维度表,形成一个星型结构。它能简化查询和分析,提高数据仓库的性能。 Slowly Changing Dimension (SCD) :缓慢变化维度处理策略,是数据仓库里的 “数据变化专家”,用于处理维度数据随时间缓慢变化的情况。它能记录维度数据的历史变化,为数据分析提供更准确的依据。 Data Cube :数据立方体,是数据仓库里的 “多维数据分析神器”,能对数据进行多维聚合和分析,帮助用户从不同角度查看数据。就像一个魔方,可以随意旋转和查看不同的面。
安全与合规
SQL Injection :SQL 注入攻击,是数据库里的 “安全黑洞”,攻击者通过在输入框中插入恶意 SQL 语句,获取数据库中的敏感信息。就像黑客通过一个小小的漏洞,潜入数据库的 “心脏”。 Data Masking :数据脱敏,是数据库里的 “隐私保护伞”,通过替换、加密等方式隐藏敏感数据,保护用户隐私。比如将身份证号、手机号等敏感信息进行模糊处理,防止泄露。 TDE :透明数据加密,是数据库里的 “数据保险箱”,对静态数据进行加密,即使数据被盗,也无法直接读取。它在数据存储和传输过程中提供安全保障。 GDPR Compliance :欧盟通用数据保护条例合规,是数据库里的 “法律红线”,要求企业在处理欧盟公民数据时,必须遵守严格的数据保护规定,保障用户隐私和数据安全。 Audit Logging :审计日志,是数据库里的 “安全监控器”,记录数据库的操作行为,包括用户登录、数据修改、查询等。它能帮助管理员追踪和分析数据库的安全事件,及时发现和处理问题。
老铁们,这 50 个数据库常见术语是不是让你对数据库领域有了更清晰的认识?无论是学习 Oracle 数据库运维,还是探索其他数据库技术,掌握这些术语都是迈向成功的第 一步。在接下来的学习中,大家可以根据这些术语深入了解相关知识,不断积累实践经验,相信你一定能成为数据库领域的高手!
往期文章回顾
MOP社区新闻
金仓专栏
告别繁琐!KingbaseES v9数据库一键安装-青学会&金仓专栏(1)
KingbaseES v9数据库Docker安装-青学会&金仓专栏(2)
DBA实战小技巧
实战:记一次RAC故障排查
DBA实战运维小技巧安装篇(一)Oracle 主流版本不同架构下的静默安装指南
DBA实战运维小技巧存储篇(一)根目录满了如何处理
DBA实战运维小技巧存储篇(二)打包迁移单机数据库至新存储
MOP社区投稿-内核开发
简单解析 IvorySQL 增强 Oracle xml 兼容能力的原理
简单讨论 PostgreSQL C语言拓展函数返回数据表的方式
简单分析 pg_config 程序的作用与原理
Redis 日志机制简介(一):SlowLog
Redis 日志机制简介(二):AOF 日志
Redis 日志机制简介(三):RDB 日志
pg_cron插件使用介绍
Redis 的指令表实现机制简介
pg几款源码工具介绍
Redis 事务功能简介




