什么是线性回归
- 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。
- 中译中翻译成人话就是:线性回归啊,说白了就是 找俩事儿之间的 “固定关系” —— 比如 “广告花了多少钱” 和 “最后卖了多少钱”,它想弄清楚:是不是广告多花 1 块,销售额就固定多赚几块?然后把这个 “多花 1 块赚 X 块” 的规律找出来,以后就能照着这个规律猜:下次花 5000 块广告,能赚多少;想赚 10 万,得投多少广告。
模拟说明
- 假设收集了 12 个月的广告投入(单位:万元)和对应销售额(单位:万元)数据,数据符合线性趋势(真实关系:销售额 = 5 * 广告投入 + 20 + 随机误差),模拟数据如下:
月份 广告投入(万元) 销售额(万元)
1 10 72
2 15 98
3 8 63
4 20 125
5 12 81
6 18 110
7 25 148
8 14 92
9 9 68
10 22 133
11 16 105
12 7 59
画成坐标图就是这样:

- 说白了就是要找到一条线,让这它几乎穿过了每个点。这样如果按照这样的规律下一次再有一个x的数值输入,那么我们就能呢推断Y的数值大致是多少了。
- 最后通过函数我们知道了这条线。

推断结果
- ==================================================
销售额预测(业务场景)
==================================================
广告投入 13 万元 → 预期销售额:87.80 万元
广告投入 20 万元 → 预期销售额:122.93 万元
广告投入 28 万元 → 预期销售额:163.06 万元
广告投入 35 万元 → 预期销售额:198.18 万元
业务决策建议
- 加大广告投入:因投入产出比达 1:5,在预算允许范围内可增加广告投放(如从 20 万提升至 28 万,预期销售额增长 40 万元)。
- 设定目标阈值:若目标销售额为 150 万元,可反推需投入广告:(150 - 19.87) / 5.02 ≈ 26 万元。
风险控制:模型 RMSE 仅 2.83 万元,预测误差小,可基于该模型制定营销预算和销售目标,风险可控。
那么如果结合数据库来做怎么办?
- 既然通过模拟数据可以做出这个结果,那么我第一感觉就是如果在数据库实现。我就设计表的时候,让这个表的一列是广告投入,另外一个列是销售额(已经有的历史数据)所以表的设计是很重要的。否这里会是一个多表链接(甚至是跨库的操作)

- 写入数据

- 最后效果就是这样:

- 数据也是一模一样的:
- 销售额预测(业务场景)
==================================================
广告投入 13 万元 → 预期销售额:87.80 万元
广告投入 20 万元 → 预期销售额:122.93 万元
广告投入 28 万元 → 预期销售额:163.06 万元
广告投入 35 万元 → 预期销售额:198.18 万元
重点来了
-
如果我们篡改了数据:
-

-
那么结果就是:
-

-
销售额预测(业务场景)
==================================================
广告投入 13 万元 → 预期销售额:97.31 万元
广告投入 20 万元 → 预期销售额:96.15 万元
广告投入 28 万元 → 预期销售额:94.83 万元
广告投入 35 万元 → 预期销售额:93.68 万元 -
可以看出简直是什么都不是了。
所谓智能化的基础是信息化
- 如果连基本的数据都不对,想做好AI是不可能的。
- 可惜MySQL社区版没有自身的模型,以上都是用python去演示的,但是Oracle有。

- 上图还是Oracle23AI的,最新的26AI,我没有。但是我相信这些只会是越做越好。
- 带给我们的思考就是,怎么控制好数据库对象设计以及数据质量。
最后修改时间:2025-11-01 16:04:40
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




