暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【Apache Doris】周FAQ集锦:第 24 期

一臻数据 2024-11-11
156

  引言   

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。


 






      SQL问题      

Q1 doris的倒排索引,如果查询时要精确匹配不走分词,需要怎么写?

A1 全文检索短语匹配,可以通过 MATCH_PHRASE 完成。 
倒排索引内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/table-design/index/inverted-index



      数据操作问题      

Q2 doris的异步物化视图是否支持基表数据写入时触发式更新对应视图?

A2 2.1.4后支持构建支持内表触发式更新,如果物化视图使用的是内表,如果内表数据发生变化,可以触发物化视图刷新,需要在创建物化视图时指定 REFRESH ON COMMIT。 
建议升级至>=2.1.6稳定版本。 
2.1.4 release note内容可查阅: 
https://doris.apache.org/zh-CN/docs/releasenotes/v2.1/release-2.1.4/
Q3 doris的flink-doris-connector如何忽略源端的delete操作?
A3 如下:
# 修改如下属性即可:
sink.enable-delete=false
# 此属性设置为false后,有delete时相当于append操作,即写入入一条一模一样的数据。

Flink Doris Connector内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/ecosystem/flink-doris-connector
Q4 doris的hive catalog性能如何
A4 doris的hive catalog用的不是jdbc,性能优异,且非常便捷,通过hms映射元数据直接去拉取HDFS/S3上的文件进行读写。 
hive catalog内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/lakehouse/datalake-analytics/hive
Q5 doris的stream load导入时,为什么到一定使用内存时任务就被cancel?
A5 通常是数据量过大导致,可以调大下be对应的配置项: 
# stream load一般适用于导入几个 GB 以内的数据,不适合导入过大的数据。 
curl -X POST http://{be_ip}:{be_http_port}/api/update_config
?streaming_load_max_mb=xxx

stream load内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/data-operate/import/import-way/stream-load-manual
Q6 doris查看tablet的元数据情况时,segment 为什么会存在0的情况?
A6 通常是导入数据时,数据hash到多个tablet,会存在某些tablet没有hash到数据,所以segment数量是0;且这种segment不怎么占用compaction资源。
Q7 doris 在使用 Select Into Outfile 导出文件到本地时,是否可以导出到指定 BE 所在服务器?
A7 不可以。使用 Select Into Outfile 导出文件到本地时,会随机导出到某个本地路径,暂不支持导出到指定路径。 
Select Into Outfile内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/data-operate/export/outfile



      运维常见问题      

Q8 fe进程挂时,如何确认是否为异常kill?

A8 如下:
# 查看下fe.out 中有没有kill pid的日志
grep "kill" fe.out 

Q9 doris集群中系统缓存一直很高,是否正常?

A9 这个指标时操作系统自动调度的,如果集群正常读写可以不用关注。



      其它问题      

Q10 kettle到doris是否有插件?

A10 Kettle Doris的插件,用于在Kettle中通过 Stream Load 将其他数据源的数据写入到 Doris 中。 
该插件是利用 Doris 的 Stream Load 功能进行数据导入的。需要配合 Kettle 服务一起使用。 
Kettle Doris Plugin内容可查阅: 
https://doris.apache.org/zh-CN/docs/dev/ecosystem/kettle


 一臻数据致力于大数据AI时代的前沿内容分享,会持续分享更多有趣有用有态度的知识。同时也欢迎大家投稿,共建共进,帮助圈友们冲破认知壁垒,实现自我提升!

另外,一臻整理了一份《Apache Doris知识库》,其中包含 Apache Doris 学习资料、方案中心、企业实践  问题指南 等内容,会持续更新,欢迎关注公众号,免费领取

资料获取 🔗 欢迎扫描下方二维码图片 加入【Apache Doris社区】免费领取❗️



往期推荐

走进开源,拥抱开源

【Apache Doris】周FAQ集锦:第 23 期

【Apache Doris】周FAQ集锦:第 22 期

【Apache Doris】周FAQ集锦:第 21 期

【Apache Doris】周FAQ集锦:第 20 期

【Apache Doris】周FAQ集锦:第 19 期

【Apache Doris】周FAQ集锦:第 18 期

【Apache Doris】周FAQ集锦:第 17 期

【Apache Doris】周FAQ集锦:第 16 期

【Apache Doris】周FAQ集锦:第 15 期

【Apache Doris】周FAQ集锦:第 14 期

【Apache Doris】周FAQ集锦:第 13 期

【Apache Doris】周FAQ集锦:第 12 期









关于社区






Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。 
如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:
💡官网文档:https://doris.apache.org 
💡社区论坛:https://ask.selectdb.com 
💡GitHub:https://github.com/apache/doris 
💡dev邮件组:dev@doris.apache.org
非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。
相信,您的参与将帮助Apache Doris变得更加完善。

▼   点击阅读原文,发现更多精彩!

文章转载自一臻数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论