
欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!
在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。
通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。
Q1 doris的倒排索引,如果查询时要精确匹配不走分词,需要怎么写?
A1 全文检索短语匹配,可以通过 MATCH_PHRASE 完成。 https://doris.apache.org/zh-CN/docs/dev/table-design/index/inverted-indexQ2 doris的异步物化视图是否支持基表数据写入时触发式更新对应视图?
A2 2.1.4后支持构建支持内表触发式更新,如果物化视图使用的是内表,如果内表数据发生变化,可以触发物化视图刷新,需要在创建物化视图时指定 REFRESH ON COMMIT。 https://doris.apache.org/zh-CN/docs/releasenotes/v2.1/release-2.1.4/Q3 doris的flink-doris-connector如何忽略源端的delete操作?# 修改如下属性即可:
sink.enable-delete=false
# 此属性设置为false后,有delete时相当于append操作,即写入入一条一模一样的数据。
Flink Doris Connector内容可查阅: https://doris.apache.org/zh-CN/docs/dev/ecosystem/flink-doris-connectorQ4 doris的hive catalog性能如何A4 doris的hive catalog用的不是jdbc,性能优异,且非常便捷,通过hms映射元数据直接去拉取HDFS/S3上的文件进行读写。 https://doris.apache.org/zh-CN/docs/dev/lakehouse/datalake-analytics/hiveQ5 doris的stream load导入时,为什么到一定使用内存时任务就被cancel?A5 通常是数据量过大导致,可以调大下be对应的配置项: # stream load一般适用于导入几个 GB 以内的数据,不适合导入过大的数据。
curl -X POST http://{be_ip}:{be_http_port}/api/update_config
?streaming_load_max_mb=xxx
https://doris.apache.org/zh-CN/docs/dev/data-operate/import/import-way/stream-load-manualQ6 doris查看tablet的元数据情况时,segment 为什么会存在0的情况?A6 通常是导入数据时,数据hash到多个tablet,会存在某些tablet没有hash到数据,所以segment数量是0;且这种segment不怎么占用compaction资源。Q7 doris 在使用 Select Into Outfile 导出文件到本地时,是否可以导出到指定 BE 所在服务器?A7 不可以。使用 Select Into Outfile 导出文件到本地时,会随机导出到某个本地路径,暂不支持导出到指定路径。 Select Into Outfile内容可查阅: https://doris.apache.org/zh-CN/docs/dev/data-operate/export/outfileQ8 fe进程挂时,如何确认是否为异常kill?
# 查看下fe.out 中有没有kill pid的日志
grep "kill" fe.out
Q9 doris集群中系统缓存一直很高,是否正常?

A9 这个指标时操作系统自动调度的,如果集群正常读写可以不用关注。Q10 kettle到doris是否有插件?
A10 Kettle Doris的插件,用于在Kettle中通过 Stream Load 将其他数据源的数据写入到 Doris 中。 该插件是利用 Doris 的 Stream Load 功能进行数据导入的。需要配合 Kettle 服务一起使用。 Kettle Doris Plugin内容可查阅: https://doris.apache.org/zh-CN/docs/dev/ecosystem/kettle
一臻数据致力于大数据AI时代的前沿内容分享,会持续分享更多有趣有用有态度的知识。同时也欢迎大家投稿,共建共进,帮助圈友们冲破认知壁垒,实现自我提升!
另外,一臻整理了一份《Apache Doris知识库》,其中包含 Apache Doris 学习资料、方案中心、企业实践 和 问题指南 等内容,会持续更新,欢迎关注公众号,免费领取。
资料获取 🔗 欢迎扫描下方二维码图片 加入【Apache Doris社区】免费领取❗️


Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。
如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:💡官网文档:https://doris.apache.org 💡社区论坛:https://ask.selectdb.com 💡GitHub:https://github.com/apache/doris 💡dev邮件组:dev@doris.apache.org非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。相信,您的参与将帮助Apache Doris变得更加完善。▼ 点击阅读原文,发现更多精彩!