支持的数据类型
目前大数据领域,基于HDFS文件系统的主流文件格式有ORC及PARQUET。GaussDB 200主要支持ORC文件格式。用户利用HIVE将数据导入HDFS文件系统后存储为ORC文件格式,使用GaussDB 200对ORC文件内的数据进行查询分析,这样需要在ORC文件格式支持的数据类型与GaussDB 200自身支持数据类型间进行匹配,匹配状况如表1所示:
类型名称 |
GaussDB 200 HDFS外表支持类型 |
数据导入HDFS时,HIVE建表类型 |
|---|---|---|
2字节整数 |
SMALLINT |
SMALLINT |
4字节整数 |
INTEGER |
INT |
8字节整数 |
BIGINT |
BIGINT |
单精度浮点数 |
FLOAT4 (REAL) |
FLOAT |
双精度浮点型 |
FLOAT8(DOUBLE PRECISION) |
DOUBLE |
科学数据类型 |
DECIMAL[p (,s)] 最大支持38位精度 |
DECIMAL最大支持38位(HIVE 0.11) |
日期类型 |
DATE |
DATE |
时间类型 |
TIMESTAMP |
TIMESTAMP |
BOOLEAN类型 |
BOOLEAN |
BOOLEAN |
Char类型 |
CHAR(n) |
CHAR (n) |
VarChar类型 |
VARCHAR(n) |
VARCHAR (n) |
字符串(文本大对象) |
TEXT(CLOB) |
STRING |
- GaussDB 200 HDFS外表支持NULL定义,HIVE数据表支持并采用相对应的NULL定义。
- GaussDB 200 HDFS外表的日期和时间类型,不支持时区定义,HIVE不支持时区定义。
- HIVE中date类型只有日期,没有时间,GaussDB 200的date类型包含日期和时间。
- GaussDB 200支持ORC的压缩格式,包括ZLIB,SNAPPY,LZ4及NONE压缩方式。
- 其中FLOAT4格式本身存在不精准问题,求和等操作在不同环境下可能产生不同的结果,在高精度要求场景下建议使用DECIMAL类型代替。
- 兼容Teradata数据库模式下,HDFS外表不支持DATE类型。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




