暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

学习DuckDB,怎能错过这两本免费的书

alitrack 2024-03-11
2021

DuckDB in Action

DuckDB in Action(DuckDB 实战)

MotherDuck 很高兴提供 Mark Needham、Michael Hunger 和 Michael Simons 所著的 Manning 出版社《DuckDB 实战》一书的免费早期访问 PDF。作者们将随着时间的推移添加新的章节,并将免费发送给您。

《DuckDB 实战》包含以下内容:

  • • 第1章:DuckDB 简介

    • • DuckDB,一个单节点内存数据库,在大数据时代为何出现

    • • DuckDB 的能力

    • • DuckDB 的工作原理以及如何融入你的数据管道

  • • 第2章:开始使用 DuckDB

    • • 安装并学习如何使用 DuckDB 命令行界面(CLI)

    • • 在 DuckDB CLI 中执行命令

    • • 查询远程文件

  • • 第3章:执行 SQL 查询

    • • SQL 语句的不同类别及其基本结构

    • • 创建表格和结构以摄取现实世界的数据集

    • • 为详细分析大型数据集打下基础

    • • 探索 DuckDB 特有的 SQL 扩展

  • • 第4章:高级数据聚合与分析

    • • 在摄取数据时进行准备、清洗和聚合

    • • 使用窗口函数在任何数据集的不同分区上创建新的聚合

    • • 理解不同类型的子查询

    • • 使用公用表表达式(CTEs)

    • • 对任何聚合应用过滤器

  • • 第5章:无需持久化的数据探索

    • • 将 CSV 文件转换为 Parquet 格式

    • • 自动推断文件类型和数据模式

    • • 创建视图以简化对嵌套 JSON 文档的查询

    • • 探索 Parquet 文件的元数据

    • • 查询其他数据库,如 SQLite

  • • 第6章:与 Python 生态系统集成

    • • DuckDB 实现的 Python DB-API 2.0 与 DuckDB 关系型 API 之间的区别

    • • 通过 Python API 从 pandas DataFrames、Apache Arrow Tables 等摄取数据

    • • 使用 DuckDB 方法查询 pandas DataFrames

    • • 将数据导出到各种 DataFrame 格式和 Apache Arrow Tables

    • • 使用 DuckDB 的关系型 API 来组合查询

  • • 第7章:在云中使用 MotherDuck 的 DuckDB

    • • MotherDuck 的背后理念

    • • 理解其底层架构的工作原理

    • • 无服务器 SQL 分析的用例

    • • 创建、管理和共享 MotherDuck 数据库

    • • 优化 MotherDuck 使用的技巧

  • • 第8章:使用 DuckDB 构建数据管道

    • • 数据管道的含义和相关性

    • • DuckDB 作为管道一部分可以扮演的角色

    • • DuckDB 如何与工具(如基于 Python 的数据加载工具 dlt 用于摄取,以及 dbt Labs 的数据构建工具 dbt 用于转换)集成

    • • 使用 Dagster 编排管道

下载地址

https://motherduck.com/duckdb-book-brief/

DuckDB Documentation

本文档包含 DuckDB 的官方文档和指南。

下载地址:https://duckdb.org/duckdb-docs.pdf

如果你想偷懒,也可以输入关键词 duckdb 从本公众号获取


文章转载自alitrack,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论