暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Vertica 23.4.x版本新功能

simonchiang 2024-08-29
119

0.总结

  1. 数据导出和复制:支持从源数据库启动基于服务器的复制,使数据同步更灵活。
  2. 数据加载:自动加载新文件并支持松散的 ORC 模式匹配,优化了数据导入效率。此外,支持从分区路径进行数据加载和修剪,提升查询性能。
  3. 数据库管理:某些 API 端点不再需要身份验证,简化了数据库管理操作。
  4. 机器学习:新增卡方独立性检验函数和 ARIMA 模型的差分功能,增强了时间序列预测能力。
  5. 管理控制台:改进了 Google Cloud 平台上的自定义图像创建,重新设计了主页和工具栏导航,提升了用户体验。
  6. 安全和身份验证:新增无密码身份验证功能,通过凭证转发和 TLS 身份验证简化了连接过程。
  7. 存储过程:支持 OUT 和 INOUT 参数模式,允许存储过程返回结果集。
  8. 升级和安装:安装脚本新增了no-rpm-copy选项,跳过繁琐的 RPM 文件复制过程,加快安装速度。

1. 数据导出和复制

1.1 从源数据库启动基于服务器的复制

您现在可以从源数据库启动基于服务器的复制。复制步骤类似于目标启动的复制,不同之处在于您必须从源数据库连接到目标数据库,并在调用REPLICATE时在TO子句中指定目标数据库。有关更多信息,请参阅基于服务器的复制

2. 数据加载

2.1 自动加载新文件

数据加载器会自动从某个位置加载新文件,这样您就不必手动将它们添加到 Vertica。自动将新数据加载到 ROS 表中是使用外部表的替代方法,可以节省对象存储的 API 成本。

数据加载器与数据路径和目标表绑定。执行时,加载器会尝试加载之前未加载过的文件。加载器具有重试限制,以防止反复尝试格式错误的文件。每个加载器都会在关联表中记录监控信息。

要定期运行数据加载器,您可以使用计划存储过程来执行加载器。

有关详细信息和示例,请参阅自动加载

2.2 ORC 解析器支持松散模式匹配

默认情况下,ORC 解析器使用强模式匹配。这意味着加载必须使用数据中的所有列,并且按照它们在数据中出现的顺序进行。您可以改为使用松散模式匹配,这样您就可以选择所需的列并忽略其余列。松散模式匹配取决于数据中列的名称而不是其顺序,因此表中的列名必须与数据中的列名匹配。类型必须匹配或可强制转换。ORC 的松散模式匹配的行为与 Parquet 的行为相同。有关如何使用松散模式匹配的详细信息,请参阅 ORC参考页。

2.3 分区路径

Vertica 以前支持 Hive 样式分区数据的分区修剪。Vertica 现在支持从任何分区路径加载和修剪。例如,给定路径/data/2023/01,您现在可以从路径中读取年份和月份值,并且在查询时 Vertica 会自动跳过读取不需要的分区目录。请参阅分区数据

3. 数据库管理

3.1 端点身份验证

以下文档端点不再需要身份验证:

4. 机器学习

4.1 支持卡方独立性检验

使用新的CHI_SQUARED函数,您可以计算两个分类变量的条件卡方独立性检验,以找出两个变量独立的可能性。该函数还支持以另一组变量为条件进行测试的选项。

4.2 ARIMA 模型支持差分

Vertica 中的ARIMA模型现在支持差分。此操作可以消除或减少时间序列数据中的趋势。要训练应用差分的 ARIMA 模型,请将集成参数设置d为 1 到 10 之间的整数。此值指定模型的差分阶数,它决定了将差分操作应用于输入数据的次数。

有关训练使用差分的 ARIMA 模型的示例,请参阅ARIMA 模型示例

5. 管理控制台

5.1 Google Cloud Platform 上的自定义图像

您可以为 Google Cloud Platform (GCP) 创建自定义管理控制台 (MC) 映像。使用已发布的 MC 映像创建一个实例,然后在该实例上添加依赖项或更改环境设置。进行更改后,您可以创建一个包含已发布的 MC 实例和新依赖项或设置的新映像。您可以在创建或恢复子集群时使用新映像。

有关详细信息,请参阅自定义 GCP 图像

5.2 主页重新设计

管理控制台 (MC) 主页采用了全新的设计,提供了一个中心位置来查看和处理有关 MC 管理的数据库的关键信息。

登录 MC 后,您将进入数据库页面,该页面有一个交互式仪表板,显示每个数据库和子集群的重要详细信息。您可以选择执行数据库操作,仪表板图形链接到 MC 的相关部分。

有关详细信息,请参阅管理控制台主页

5.3 工具栏和导航重新设计

工具栏和导航采用新设计,以提供增强且一致的用户体验。

  • 工具栏可以快速访问警报、语言选择器、Vertica 资源和用户操作。
  • MC 导航现在是一个多级窗格,可用于访问系统级和特定部分的导航选项。您可以从 MC 中的任何位置访问系统级选项,并且每个系统级选项都会显示特定部分的选项。

有关详细信息,请参阅管理控制台工具栏和导航

6. 安全和身份验证

6.1 连接到 VERTICA:无密码身份验证

现在,您可以在调用 CONNECT TO VERTICA 时省略用户密码,而是使用以下方法之一向目标数据库进行身份验证:

  • 凭证转发:将当前用户的密码转发到目标数据库
  • TLS 身份验证:使用 TLS 进行身份验证

有关详细信息,请参阅连接到 VERTICA

7. 存储过程

7.1 OUT 和 INOUT 参数模式

现在,您可以从具有 OUT 和 INOUT 参数的存储过程(对于非复杂数据类型)中返回结果集值。有关详细信息,请参阅参数模式

8. 升级和安装

8.1 运行安装脚本时跳过 RPM 复制

安装脚本现在支持一个no-rpm-copy选项,该选项可绕过将 RPM 复制到集群中每个节点的耗时步骤。RPM 必须存在于 指定的每个节点上--hosts,并且您必须使用 选项提供本地 RPM 文件的路径--rpm-path。有关详细信息,请参阅--no-rpm-copy
二维码.png

最后修改时间:2024-09-27 14:35:44
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论