
DuckDB in Action(DuckDB 实战)
MotherDuck 很高兴提供 Mark Needham、Michael Hunger 和 Michael Simons 所著的 Manning 出版社《DuckDB 实战》一书的免费早期访问 PDF。作者们将随着时间的推移添加新的章节,并将免费发送给您。
《DuckDB 实战》包含以下内容:
• 第1章:DuckDB 简介
• DuckDB,一个单节点内存数据库,在大数据时代为何出现
• DuckDB 的能力
• DuckDB 的工作原理以及如何融入你的数据管道
• 第2章:开始使用 DuckDB
• 安装并学习如何使用 DuckDB 命令行界面(CLI)
• 在 DuckDB CLI 中执行命令
• 查询远程文件
• 第3章:执行 SQL 查询
• SQL 语句的不同类别及其基本结构
• 创建表格和结构以摄取现实世界的数据集
• 为详细分析大型数据集打下基础
• 探索 DuckDB 特有的 SQL 扩展
• 第4章:高级数据聚合与分析
• 在摄取数据时进行准备、清洗和聚合
• 使用窗口函数在任何数据集的不同分区上创建新的聚合
• 理解不同类型的子查询
• 使用公用表表达式(CTEs)
• 对任何聚合应用过滤器
• 第5章:无需持久化的数据探索
• 将 CSV 文件转换为 Parquet 格式
• 自动推断文件类型和数据模式
• 创建视图以简化对嵌套 JSON 文档的查询
• 探索 Parquet 文件的元数据
• 查询其他数据库,如 SQLite
• 第6章:与 Python 生态系统集成
• DuckDB 实现的 Python DB-API 2.0 与 DuckDB 关系型 API 之间的区别
• 通过 Python API 从 pandas DataFrames、Apache Arrow Tables 等摄取数据
• 使用 DuckDB 方法查询 pandas DataFrames
• 将数据导出到各种 DataFrame 格式和 Apache Arrow Tables
• 使用 DuckDB 的关系型 API 来组合查询
• 第7章:在云中使用 MotherDuck 的 DuckDB
• MotherDuck 的背后理念
• 理解其底层架构的工作原理
• 无服务器 SQL 分析的用例
• 创建、管理和共享 MotherDuck 数据库
• 优化 MotherDuck 使用的技巧
• 第8章:使用 DuckDB 构建数据管道
• 数据管道的含义和相关性
• DuckDB 作为管道一部分可以扮演的角色
• DuckDB 如何与工具(如基于 Python 的数据加载工具 dlt 用于摄取,以及 dbt Labs 的数据构建工具 dbt 用于转换)集成
• 使用 Dagster 编排管道
下载地址
https://motherduck.com/duckdb-book-brief/
DuckDB Documentation
本文档包含 DuckDB 的官方文档和指南。
下载地址:https://duckdb.org/duckdb-docs.pdf
如果你想偷懒,也可以输入关键词 duckdb 从本公众号获取




