巨杉 Tech | 巨杉数据库数据高性能数据导入迁移实
践
SequoiaDB 一款自研金融级分布式数据库产品,支持标准 SQL 和分布式事务功能、支持复
杂索引查询,兼容 MySQL、PGSQL、SparkSQL 等 SQL 访问方式。SequoiaDB 在分布式存
储功能上,较一般的大数据产品提供更多的数据切分规则,包括:水平切分、范围切分、主
子表切分和多维切分方式,用户可以根据不用的场景选择相应的切分方式,以提高系统的存
储能力和操作性能。
为了能够提供简单便捷的数据迁移和导入功能,同时更方便地与传统数据库在数据层进行对
接,巨杉数据库支持多种方式的数据导入,用户可以根据自身需求选择最适合的方式加载数
据。
本文主要介绍巨杉数据库集中常见的高性能数据导入方法,其中包括巨杉工具矩阵中的
Sdbimprt 导入工具,以及使用 SparkSQL, MySQL 和原生 API 接口进行数据导入,一共四种
方式。
Sdbimprt 工具导入
sdbimprt 是 SequoiaDB 的数据导入工具,是巨杉数据库工具矩阵中重要组成之一,它可以
将 JSON 格式或 CSV 格式的数据导入到 SequoiaDB 数据库中。
关于工具说明与参数介绍,请参考:http://doc.sequoiadb.com/cn/sequoiadb-cat_id-1479195620-edition_id-
0。
一、示例
下面简单介绍一下如何使用 sdbimprt 工具将 csv 文件导入到 SequoiaDB 集合空间 site
的集合 user_info 中:1. 数据文件名称为“user.csv”,内容如下:
sdbimprt --hosts=localhost:11810 --type=csv --file=user.csv -c site -l user_info --
fields='name string default "Anonymous", age int, country'
评论