点击上方 蓝字 关注一臻数据👆
免费领取 DeepSeek➕数字AI知识库 🔗 一起共建共进
❝雨后的午时很惬意,突然收到一连串WX的消息:
"ai查doris能代替sql吗"
"有个sql加catalog加db引用检查需求能用ai实现吗"
"例如让ai检查sql判断所有表有没加catalog.db前缀"
...
看完消息后,我回了句:"这种不是一个脚本遍历就搞掂了么😂"
"这不是想找个应用场景实践下AI嘛"
"好滴,安排!"
今天我们直接用最近很火的扣子空间+MCP来快速验证下👇

Coze+MCP快速验证
直接登录扣子空间(文末附邀请码获取方式
)🔗 https://space.coze.cn/

配置好基本的DB连接信息后,添加MySQL MCP,用于连接通信Doris集群进行查询服务。
然后结合Doris的审计日志功能(https://doris.apache.org/zh-CN/docs/dev/admin-manual/audit-plugin
),直接输入如下的提示词让Coze开始帮我们全自动化干活:
我需要你作为一个Doris SQL审计专家,协助我检查MySQL连接中的SQL语句是否正确使用了catalog和database前缀。
catalog.database前缀的定义:常见数据库查询是db和table两级目录,例如select * from db.table,其中db表示库名,中间以.分割,后面是table表名;而带有catalog.database前缀的sql:select * from catalog.db.table,其中db和table和前面意义一样,catalog指的是数据目录层级。
请基于以下信息执行任务:
数据源信息:
- 审计日志存储在 __internal_schema 库的 audit_log 表中
- 需要分析的关键字段是 stmt,该字段包含执行过的SQL语句
任务目标:
请分析所有SQL语句,检查是否所有表引用都包含了完整的"catalog.database"前缀层级。具体需要:
1. 连接到MySQL MCP并访问 __internal_schema 数据库
2. 从 audit_log 表中提取所有SQL语句(stmt字段)
3. 解析每条SQL语句,识别其中的表引用
4. 检查每个表引用是否包含完整的catalog.database前缀
5. 生成报告,列出所有缺少catalog.database前缀的表引用,包括:
- 原始SQL语句
- 表引用位置
- 推荐的修正建议
分析要求:
- 需要识别各种SQL语句类型(SELECT, INSERT, UPDATE, DELETE等)
- 考虑子查询、JOIN操作、WITH子句等复杂SQL结构
- 排除注释中的内容
- 处理别名和引号的情况
- 识别临时表和系统表的特殊情况
输出格式:
1. 总体统计数据:检查的SQL语句总数,有问题的语句数量和占比
2. 分类问题列表:按问题类型分组
3. 详细问题记录:包含原SQL、问题位置、建议修正
4. 可能的高风险SQL模式识别
请提供完整的分析代码,并确保代码能处理大量SQL语句的性能优化。
最终结果:

Coze首先配置好MySQL MCP,然后根据提示词,生成py脚本连接Doris进行查询校验,最终输出一份SQL审计报告.json
。

经过json结果和Doris中审计日志数据对比,发现有些是对的,但有些是无中生有了,例如这些INSERT
、UPDATE
和DELETE
的语句。
SO?给个机会,继续看看其它场景。
其它场景验证
其实在字节跳动悄悄上线了扣子空间,我第一时间申请了内测资格。经过几天的深度体验,我想说:扣子空间谈不上惊艳,但却是一个好的开始。
主要实测了3个场景,把几个账号的额度全部接连耗尽,但总归是差强人意...
1. Doris 直查
直接输入如下提示词,开跑:
tpch库有多少张表,分别有多少数据量
结果:

大部分和直连Doris查询的结果一致,但这个lineitem表的与SF相关
是几个意思?
2. Doris ChatBI
不纠结,继续第二个场景...
这个场景非常有意思,因为它似乎是在全网检索,然后找到了我之前发的0代码!教会你用Doris+DeepSeek+Dify搭建ChatBI系统(附完整DSL)
教程,根据里面的步骤从0到1去搭建部署...

但安装部署的过程中频频遇到卡点,即使不停的调试提示词,结果还是跑不出来结果。
思索一番,决定再试一个它擅长的场景->做网页
。
3. Doris学习平台
提示词如下:
请为我创建一个基于Apache Doris的交互式学习平台网页应用,具备以下功能:
1. 学习路径设计:
- 基于Apache Doris官方文档和全网优质资料,设计一条从入门到精通的完整学习路线
- 将内容分为初级、中级、高级三个阶段,每个阶段有明确的学习目标和技能掌握指标
2. 核心内容展示:
- 深入浅出地解释Doris的架构原理和核心概念(FE/BE架构等)
- 包含趣味性的交互式动画,直观展示Doris的数据处理流程和内部机制
- 提供真实场景下的最佳实践和性能优化指南
3. 交互式体验:
- 设计在线代码练习环境,让用户能直接在网页中执行Doris SQL语句(基于MySQL MCP扩展实现即可)
- 提供可视化的查询执行计划分析工具,帮助理解查询优化原理
- 包含实时反馈的知识检测点,确保学习效果
4. 应用界面要求:
- 现代简约的UI设计,专业而不失美感
- 清晰的内容导航和学习进度跟踪
- 适配桌面和移动设备的响应式布局
请提供这个应用的完整实现,包括前端界面设计、动画制作和后端交互逻辑。最终产品应是一个能让数据工程师和分析师高效学习掌握Apache Doris的专业工具。
经过七七四十九次调试,终于是跑了个能看能交互的网页出来了:

但内容含量十分匮乏,顶多自娱自乐一下...
结语
评价AI的牛X,不在于表面的酷炫,而在于解决实际问题的深度与效率。
通过Doris SQL审计和几个小场景的验证,我们看到扣子空间+MCP的组合展现出了一定潜力,但也存在明显局限 - 有些检测结果存在"无中生有
"的情况,三个测试场景也都表现出差强人意
的状态。
类于Manus,扣子空间的价值在于它打破了AI简单问答的框架,尝试将AI能力嵌入实际工作流程中。
这种从"回答问题
"到"解决问题
"的转变方向是正确的,即使目前实现还不够完美。对数据工程师而言,它可能无法立即彻底改变Doris使用方式,但它预示了AI辅助专业工作的广阔前景。
当我们以务实的眼光看待AI时,会发现其真正价值不是取代人类专业技能,而是在于承担那些耗时、重复、繁琐的工作环节,让大家专注于更具创造性的任务与决策。
从这个角度而言,扣子空间(AI)确实代表了"一个好的开始" - AI可期,但还不是万能的!
⚠️ 最后附录,扣子空间邀请码获取方式;
1️⃣ 私信一臻,不定期公布
2️⃣ 官文留言区不定期公布:扣子空间,开启内测!
想了解更多Apache Doris与AI的实践案例和最新玩法?可以私信、进Doris x AI群或加入Doris ima智能知识库👇


完
一臻数据致力于大数据AI时代的前沿内容分享,会持续分享更多有趣有用有态度的知识。同时也欢迎大家投稿,共建共进,帮助圈友们冲破认知壁垒,实现自我提升!
另外,整理了份 一臻数据知识库 ,其中包含 Apache Doris和 Data+AI 的学习资料、学习课程、白皮书、研究报告、行业标准 和 实践指南 等内容,会持续更新,欢迎关注公众号,免费领取。
🔗 欢迎扫描下方二维码 ⬇️ 备注 666 免费领取资料
加入Doris官方群和全球最活跃的PowerData数据社区❗️

往期推荐

点击下方蓝字关注一臻数据




