
基于 TPC-H 数据集的可视化数据分析
1. 数据导入与处理
1.1 数据导入
用 tableau 连接 SQL Server 数据库选择 TPCH_1 数据库,将表导入建立连接,由于已
经在数据库中建立了主键和外键 tableau 会自动利用外键建立了连接,需注意红框处在
tableau 中自动连接时虽然看起来只建立了和 CUSTOMER 的连接,但是实际上会根据外键
同时建立了和 CUSTOMER 和 SUPPLIER 的内连接,要删去其中一条,否则内连接只会保留
C_NATIONKEY = S_NATIONKEY 相等的数据,导致数据丢失,从 600 万条到 20 多万条。
1.2 属性修改与层次设置
Figure 2 修改属性
Figure 1 表的连接
评论