暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

解密人大金仓KingbaseES数据库中的多表连接视图 探索可更新的数据魔法

数据猿 2023-11-13
439

信息时代,数据是驱动业务决策和创新的核心资源。数据库技术的不断发展使得我们能够存储、管理和检索大量的数据,为企业和组织提供了强大的支持。然而,随着数据量的不断增加,有效地处理和整合数据变得愈发复杂。

这时,多表连接视图悄然走进数据库世界,为我们带来了便利,不仅能够将多个表中的数据整合在一起,同时还以其可更新的特性,为数据管理带来了全新的可能性。

本文将带您深入探索KingbaseES数据库中的多表连接视图及其可更新性。从基本概念到实际应用,我们将解密这项高效技术,揭示其背后的原理和优势,帮助您更好地运用多表连接视图来优化数据库操作,释放数据魔法的潜力!

揭开数据的迷雾 多表连接视图的崭新世界

多表连接视图是指构建视图的顶层查询引用了多个数据表,通过支持多表连接视图的更新操作,可以实现基于连接视图进行数据表的更新操作(DML),包括插入(INSERT)、更新(UPDATE)和删除(DELETE)。

数据交织的舞台 理解多表连接与关系

  • 视图(View):视图是一种虚拟的表,是从一个或多个基本表中派生的,可以像表一样进行查询和更新操作。对于可更新视图,用户可以通过视图来更新基本表中的数据。
    • 单表视图,是指视图的查询只涉及单个数据表,如下例子中视图v1的查询中只包含表t1。
create table t1 (col1 int, col2 int);

create view v1 as select * from t1;
    • 多表视图,是指视图数据映射到多个基表。如下例子中视图v1是由表t1和t2组成,视图v1的数据与t1和t2中数据都存在映射关系。

create table t1 (c11 int primary key, c12 int);

create table t2 (c21 int primary key, c22 int); 

create view v1 as select * from t1 join t2 on (c11 = c21) where c22 > 0;
  • 键保留表(Key-Preserved Table):如果一个表的主键,是连接结果集的键,则称该表是键值保护的,也可以简单理解为存在一个单向的映射,视图中的每一行数据能唯一映射到基表中的一行数据。键保留表是理解多表连接视图是否可更新的基础,当多表连接视图的基表中存在一个或多个键保留表时,则该视图为可更新视图。
  • 目标基表(target base table):对于多表连接视图进行更新操作时,会转换为对其中某一个基表的更新操作,实际更新的表称为目标基表。
  • 目标基表与键保留表的关系:目标基表必须为键保留表。

多表连接视图的幕后机制

一、视图的更新操作

用户可以通多对视图进行更新操作实现对表数据的更新,可以减少编程的工作量,同时隐藏数据表的结构,实现数据对用户间不同的可见性,保证数据安全。对视图执行更新操作,最终会将更新操作(Insert/Update/Delete)重定向到某一个基表,从而实现对于基表的数据更新操作,视图中可能存在多个可以更新的基表(键保留表),每一条DML语句只能作用于一个数据表,本文后续内容主要讨论多表连接视图的更新问题。

二、视图的可更新性判断

前文已经讲到对于多表连接视图,当存在一个或多个键保留表时,我们认为这个视图中的键保留表是可以更新的。

  • 如何找到视图中的键保留表?
    • 为了满足键保留表的条件,查询中不能存在影响查询结果集一一映射关系的子句,如:聚集、分组、集合操作等,这也是存在键保留表的先前条件。
    • 多表视图由于存在不同的JOIN方式,以及连接列主键的不同情形,这时如何判断一个基表为键保留表?

简单的等值连接的两表JOIN会存在以下几种情况:

1. 两个表的连接列都不是主键:t1和t2组成视图v1且都不存在主键,则对于视图而言无键保留表。


create table t1 (col_a int, col_b char(10));

insert into t1 values (1,'aaa');

insert into t1 values (1,'aaa');

create table t2 (col_c int, col_d char(10)); 

insert into t2 values (1,'xxx');

insert into t2 values (1,'yyy');

create or replace view v1 as select * from t1 join t2 on (col_a = col_c);

select * from v1;

 col_a |   col_b    | col_c |   col_d

-------+------------+-------+------------

     1 | aaa        |     1 | xxx

     1 | aaa        |     1 | yyy

     1 | aaa        |     1 | xxx

     1 | aaa        |     1 | yyy

(4 rows)

2. 两个表的连接列都是主键列:

(1)Join类型是全外连接时不存在键保留表。
(2)若为左连接,左侧表可能是键保留表,右侧表不是键保留表。如下例子

create table t1 (col_a int primary key, col_b char(10));

insert into t1 values (1,'aaa');

insert into t1 values (2,'bbb');

insert into t1 values (3,'ccc');

insert into t1 values (4,'ddd');

create table t2 (col_c int primary key, col_d char(10)); 

insert into t2 values (1,'xxx');

insert into t2 values (2,'yyy');

create or replace view v1 as select * from t1 left join t2 on (col_a = col_c);

select * from v1;

select * from v1;

 col_a |   col_b    | col_c |   col_d

-------+------------+-------+------------

     1 | aaa        |     1 | xxx

     2 | bbb        |     2 | yyy

     3 | ccc        |       |

     4 | ddd        |       |

(4 rows)
(3)若为右连接,同理,只是结论完全相反。
(4)若为内连接,视图的每一行能映射到与两个基表中的唯一一行,所以两个表都为键保留表。

create table t1 (col_a int primary key, col_b char(10));

insert into t1 values (1,'aaa');

insert into t1 values (2,'bbb');

insert into t1 values (3,'ccc');

create table t2 (col_c int primary key, col_d char(10)); 

insert into t2 values (1,'xxx');

insert into t2 values (2,'yyy');

insert into t2 values (3,'zzz');

create or replace view v1 as select * from t1 join t2 on (col_a = col_c);

 select * from v1;

 col_a |   col_b    | col_c |   col_d

-------+------------+-------+------------

     1 | aaa        |     1 | xxx

     2 | bbb        |     2 | yyy

     3 | ccc        |     3 | zzz

(3 rows)
3. 两个表的连接列只有一个是主键列:
(1)Join类型是全外连接时不存在键保留表。
(2)Join类型如果为左连接,表T1的连接列不是主键,T2的连接列为主键,如图中组成的视图v1在T1中是可以找到唯一映射行的,满足键保留表的关系,所以T1为键保留表。同理右连接相反。

create table t1 (col_a int, col_b char(10));

insert into t1 values (1,'aaa');

insert into t1 values (2,'bbb');

insert into t1 values (3,'ccc');

insert into t1 values (3,'ddd');

create table t2 (col_c int primary key, col_d char(10)); 

insert into t2 values (1,'xxx');

insert into t2 values (2,'yyy');

insert into t2 values (3,'zzz');

create or replace view v1 as select * from t1 left join t2 on (col_a = col_c);

select * from v1;

 col_a |   col_b    | col_c |   col_d

-------+------------+-------+------------

     1 | aaa        |     1 | xxx

     2 | bbb        |     2 | yyy

     3 | ccc        |     3 | zzz

     3 | ddd        |     3 | zzz

(4 rows)


如图:

temp3

  • 外连接与可更新视图

前文讲到了,多表连接视图的可更新性和其查询中的连接方式有很大关系,因此为了更加准确的判断一个多表连接视图是否支持更新,需要对定义视图的查询进行必要的逻辑等价变换,在消除外连接后判断视图的可更新性。

  • 如何判断视图列是否可以更新?
    • 视图的列为直接查询的基表列。
    • 更新(Insert/Update/Delete)的视图列必须是键保留表的相关列,即目标表必须为键保留表,例如上面3.2章节中最后的图例中只能更新视图中col_a和col_b两个列,另外两个列col_c和col_d是不能被更新的。
    • 不可更新连接列

三、目标基表的选择

当用户对一个视图进行更新(Insert/Update/Delete)时,我们如何进行能知道用户想要操作的真正目标基表呢?

对于单表视图来说只有一个表,所以目标基表是明确的。

对于多表视图而言此过程需要根据用户的DML语句的输入来识别目标基表。

  • 首先确认视图存在键保留表;
  • 对于INSERT和UPDATE的目标基表如何选择?

      根据DML的目标列确认目标基表,目标列不能涉及多个表。

  • 对于DELETE操作不存在视图的目标列信息,如何选择目标基表呢?

       选择第一个键保留表作为目标基表。

四、视图重写过程

视图的更新实质上是对于基表的更新,在重写视图过程中涉及到哪些部分需要重写呢?

  • 视图所有表达式的引用关系都需要重定向为对目标基表的引用。
  • 若目标基表是视图(嵌套视图)。则需要合并嵌套视图的查询到上层查询当中。

  • 关于视图with check option的处理

对于单表视图的with check option,可以合并到WHERE条件中;而对于多表视图,非目标基表的条件对更新操作而言并无作用,所以只需要提取目标基表的条件即可。

数据管理的绝佳之选 多表连接视图的实用示例与优势

在以下示例中视图emp_dept由表emp和dep组成,列deptno为表dep的主键,所以且emp为键保留表,此视图为可更新的视图。

--测试表

create table dep (                                         

       deptno INT not null,                                

       dname VARCHAR(100) not null,                        

       loc VARCHAR(100) not null,                          

       Primary key (deptno)

); 

insert into dep values(10, 'Accounting', 'New York');  

insert into dep values(20, 'Research', 'Dallas'); 

insert into dep values(30, 'Sailing', 'Boston'); 

CREATE TABLE emp (

    empno number(4) PRIMARY KEY,

    ename varchar2(10) not null,

    job varchar2(10),

    mgr number(4),

    sal number(7,2),

    comm number(7,2),

    deptno int,

FOREIGN KEY (deptno) REFERENCES dep(deptno)

);

INSERT INTO emp (empno, ename, deptno) VALUES (7787, 'ford', 20);

INSERT INTO emp (empno, ename, deptno) VALUES (7788, 'wade', 30);

INSERT INTO emp (empno, ename, deptno) VALUES (7789, 'jones', 30);

INSERT INTO emp (empno, ename, deptno) VALUES (7790, 'jamie', 30);

CREATE OR REPLACE VIEW emp_dept AS

     SELECT empno, ename, emp.deptno, sal, dname, loc

      FROM emp JOIN dep 

ON (emp.deptno = dep.deptno AND dep.deptno IN (10, 20, 30));

--更新视图

update emp_dept set sal = 2000 where ename = 'ford' and dname = 'Research';

select * from emp_dept;

empno | ename | deptno | sal | dname | loc

-------+-------+--------+---------+----------+--------

7788 | wade | 30 | | Sailing | Boston

7789 | jones | 30 | | Sailing | Boston

7790 | jamie | 30 | | Sailing | Boston

7787 | ford | 20 | 2000.00 | Research | Dallas

(4 rows)

--更新emp表

update emp set sal = 3000 from dep where ename = 'ford' and dep.deptno = emp.deptno and dname = 'Research';

select * from emp_dept;

empno | ename | deptno | sal | dname | loc

-------+-------+--------+---------+----------+--------

7788 | wade | 30 | | Sailing | Boston

7789 | jones | 30 | | Sailing | Boston

7790 | jamie | 30 | | Sailing | Boston

7787 | ford | 20 | 3000.00 | Research | Dallas

(4 rows)


解锁多表连接视图的无限潜能

多表连接视图支持可更新是一种非常有用的技术,可以屏蔽复杂的数据操作逻辑,使得数据管理变得更为简单和高效,不会因DML行为而暴露基础表,同时也限制了用户的访问范围和权限,保护数据的安全性和隐私性。因此也被广泛应用于各种数据库系统和数据管理应用中。

正如我们在本文中所探讨的,多表连接视图不仅是数据的魔法,更是我们应对数据复杂性的有力工具。作为数据库领域国家队,人大金仓将积极探索更高效、更智能的数据管理方法,释放数据的无限力量!

最后修改时间:2023-11-13 13:48:29
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论