暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

我用Coze+MCP快速验证了一个Doris用户的需求...AI可期,但还不是万能的!

点击上方 蓝字 关注一臻数据👆 

免费领取 DeepSeek➕数字AI知识库 🔗 一起共建共进

雨后的午时很惬意,突然收到一连串WX的消息: 

"ai查doris能代替sql吗" 

"有个sql加catalog加db引用检查需求能用ai实现吗" 

"例如让ai检查sql判断所有表有没加catalog.db前缀" 

... 

看完消息后,我回了句:"这种不是一个脚本遍历就搞掂了么😂" 

"这不是想找个应用场景实践下AI嘛" 

"好滴,安排!" 

今天我们直接用最近很火的扣子空间+MCP来快速验证下👇

Coze+MCP快速验证

直接登录扣子空间(文末附邀请码获取方式
)🔗 https://space.coze.cn/

配置好基本的DB连接信息后,添加MySQL MCP,用于连接通信Doris集群进行查询服务。

然后结合Doris的审计日志功能(https://doris.apache.org/zh-CN/docs/dev/admin-manual/audit-plugin
),直接输入如下的提示词让Coze开始帮我们全自动化干活:

我需要你作为一个Doris SQL审计专家,协助我检查MySQL连接中的SQL语句是否正确使用了catalog和database前缀。

catalog.database前缀的定义:常见数据库查询是db和table两级目录,例如select * from db.table,其中db表示库名,中间以.分割,后面是table表名;而带有catalog.database前缀的sql:select * from catalog.db.table,其中db和table和前面意义一样,catalog指的是数据目录层级。

请基于以下信息执行任务:

数据源信息:
- 审计日志存储在 __internal_schema 库的 audit_log 表中
- 需要分析的关键字段是 stmt,该字段包含执行过的SQL语句

任务目标:
请分析所有SQL语句,检查是否所有表引用都包含了完整的"catalog.database"前缀层级。具体需要:

1. 连接到MySQL MCP并访问 __internal_schema 数据库
2. 从 audit_log 表中提取所有SQL语句(stmt字段)
3. 解析每条SQL语句,识别其中的表引用
4. 检查每个表引用是否包含完整的catalog.database前缀
5. 生成报告,列出所有缺少catalog.database前缀的表引用,包括:
   - 原始SQL语句
   - 表引用位置
   - 推荐的修正建议

分析要求:
- 需要识别各种SQL语句类型(SELECT, INSERT, UPDATE, DELETE等)
- 考虑子查询、JOIN操作、WITH子句等复杂SQL结构
- 排除注释中的内容
- 处理别名和引号的情况
- 识别临时表和系统表的特殊情况

输出格式:
1. 总体统计数据:检查的SQL语句总数,有问题的语句数量和占比
2. 分类问题列表:按问题类型分组
3. 详细问题记录:包含原SQL、问题位置、建议修正
4. 可能的高风险SQL模式识别

请提供完整的分析代码,并确保代码能处理大量SQL语句的性能优化。

最终结果:

Coze首先配置好MySQL MCP,然后根据提示词,生成py脚本连接Doris进行查询校验,最终输出一份SQL审计报告.json

经过json结果和Doris中审计日志数据对比,发现有些是对的,但有些是无中生有了,例如这些INSERT
UPDATE
DELETE
的语句。

SO?给个机会,继续看看其它场景。

其它场景验证

其实在字节跳动悄悄上线了扣子空间,我第一时间申请了内测资格。经过几天的深度体验,我想说:扣子空间谈不上惊艳,但却是一个好的开始

主要实测了3个场景,把几个账号的额度全部接连耗尽,但总归是差强人意...

1. Doris 直查

直接输入如下提示词,开跑:

tpch库有多少张表,分别有多少数据量

结果:

大部分和直连Doris查询的结果一致,但这个lineitem表的与SF相关
是几个意思?

2. Doris ChatBI

不纠结,继续第二个场景...

这个场景非常有意思,因为它似乎是在全网检索,然后找到了我之前发的0代码!教会你用Doris+DeepSeek+Dify搭建ChatBI系统(附完整DSL)
教程,根据里面的步骤从0到1去搭建部署...

但安装部署的过程中频频遇到卡点,即使不停的调试提示词,结果还是跑不出来结果。

思索一番,决定再试一个它擅长的场景->做网页

3. Doris学习平台

提示词如下:

请为我创建一个基于Apache Doris的交互式学习平台网页应用,具备以下功能:

1. 学习路径设计:
   - 基于Apache Doris官方文档和全网优质资料,设计一条从入门到精通的完整学习路线
   - 将内容分为初级、中级、高级三个阶段,每个阶段有明确的学习目标和技能掌握指标

2. 核心内容展示:
   - 深入浅出地解释Doris的架构原理和核心概念(FE/BE架构等)
   - 包含趣味性的交互式动画,直观展示Doris的数据处理流程和内部机制
   - 提供真实场景下的最佳实践和性能优化指南

3. 交互式体验:
   - 设计在线代码练习环境,让用户能直接在网页中执行Doris SQL语句(基于MySQL MCP扩展实现即可)
   - 提供可视化的查询执行计划分析工具,帮助理解查询优化原理
   - 包含实时反馈的知识检测点,确保学习效果

4. 应用界面要求:
   - 现代简约的UI设计,专业而不失美感
   - 清晰的内容导航和学习进度跟踪
   - 适配桌面和移动设备的响应式布局

请提供这个应用的完整实现,包括前端界面设计、动画制作和后端交互逻辑。最终产品应是一个能让数据工程师和分析师高效学习掌握Apache Doris的专业工具。

经过七七四十九次调试,终于是跑了个能看能交互的网页出来了:

但内容含量十分匮乏,顶多自娱自乐一下...

结语

评价AI的牛X,不在于表面的酷炫,而在于解决实际问题的深度与效率

通过Doris SQL审计和几个小场景的验证,我们看到扣子空间+MCP的组合展现出了一定潜力,但也存在明显局限 - 有些检测结果存在"无中生有
"的情况,三个测试场景也都表现出差强人意
的状态。

类于Manus,扣子空间的价值在于它打破了AI简单问答的框架,尝试将AI能力嵌入实际工作流程中。

这种从"回答问题
"到"解决问题
"的转变方向是正确的,即使目前实现还不够完美。对数据工程师而言,它可能无法立即彻底改变Doris使用方式,但它预示了AI辅助专业工作的广阔前景。

当我们以务实的眼光看待AI时,会发现其真正价值不是取代人类专业技能,而是在于承担那些耗时、重复、繁琐的工作环节,让大家专注于更具创造性的任务与决策

从这个角度而言,扣子空间(AI)确实代表了"一个好的开始" - AI可期,但还不是万能的!

⚠️ 最后附录,扣子空间邀请码获取方式;

1️⃣ 私信一臻,不定期公布

2️⃣ 官文留言区不定期公布:扣子空间,开启内测!

想了解更多Apache Doris与AI的实践案例和最新玩法?可以私信、进Doris x AI群或加入Doris ima智能知识库👇


一臻数据致力于大数据AI时代的前沿内容分享,会持续分享更多有趣有用有态度的知识。同时也欢迎大家投稿,共建共进,帮助圈友们冲破认知壁垒,实现自我提升!

另外,整理了份 一臻数据知识库 ,其中包含 Apache Doris Data+AI 的学习资料、学习课程、白皮书、研究报告、行业标准  实践指南 等内容,会持续更新,欢迎关注公众号,免费领取

🔗 欢迎扫描下方二维码 ⬇️ 备注 666 免费领取资料  加入Doris官方群和全球最活跃的PowerData数据社区❗️



往期推荐

走进开源,拥抱开源

大数据平台开发规范示例

大数据仓库开发规范示例

0代码!教会你用Doris+DeepSeek+Dify搭建ChatBI系统(附完整DSL)

3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)

3步!教会你用Doris+DeepSeek搭建ChatBI系统(保姆级教程)

99行代码!教会你用Doris+DeepSeek实现AI舆情分析

全网Doris+DeepSeek使用手册(客服/图表/PPT/贺岁诗)!学会了Doris熟练度提高90%【建议收藏】

都2025年了,Doris 和 ClickHouse 到底怎么选啊!

深夜无需加班,Apache Doris让数据自己会跑

我用X2Doris干翻了3000张表,老板还以为我组了个团队

点击下方蓝字关注一臻数据

文章转载自青年数据库学习互助会,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论