排行
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
中国数据库
向量数据库
时序数据库
实时数据库
搜索引擎
空间数据库
图数据库
数据仓库
大调查
2021年报告
2022年报告
年度数据库
2020年openGauss
2021年TiDB
2022年PolarDB
2023年OceanBase
首页
资讯
活动
大会
学习
课程中心
推荐优质内容、热门课程
学习路径
预设学习计划、达成学习目标
知识图谱
综合了解技术体系知识点
课程库
快速筛选、搜索相关课程
视频学习
专业视频分享技术知识
电子文档
快速搜索阅览技术文档
文档
问答
服务
智能助手小墨
关于数据库相关的问题,您都可以问我
数据库巡检平台
脚本采集百余项,在线智能分析总结
SQLRUN
在线数据库即时SQL运行平台
数据库实训平台
实操环境、开箱即用、一键连接
数据库管理服务
汇聚顶级数据库专家,具备多数据库运维能力
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
我的订单
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
资讯
活动
大会
课程
文档
排行
问答
我的订单
首页
专家团队
智能助手
在线工具
SQLRUN
在线数据库即时SQL运行平台
数据库在线实训平台
实操环境、开箱即用、一键连接
AWR分析
上传AWR报告,查看分析结果
SQL格式化
快速格式化绝大多数SQL语句
SQL审核
审核编写规范,提升执行效率
PLSQL解密
解密超4000字符的PL/SQL语句
OraC函数
查询Oracle C 函数的详细描述
智能助手小墨
关于数据库相关的问题,您都可以问我
精选案例
新闻资讯
云市场
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
专家团队
智能助手
精选案例
新闻资讯
云市场
微信扫码
复制链接
新浪微博
分享数说
采集到收藏夹
分享到数说
首页
/
财政收入影响因素分析及预测模型(四)
财政收入影响因素分析及预测模型(四)
泰迪教育
2020-06-24
1070
本文为泰迪学院最新推出的数据挖掘实战专栏第三篇,本专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快、更好的学习数据挖掘知识与积累职业经验。
专栏中每四篇文章为一个完整的数据挖掘案例。案例介绍顺序为:先由数据案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。
为方便读者轻松地获取一个真实的实验环境,本专栏使用大家熟知的Python语言对样本数据进行处理以进行挖掘建模。
下面进入最终篇,上机实验及拓展思考~
实验目的
(1) 掌握Lasso回归特征选择。
(2) 构建灰色预测与神经网络预测模型。
实验内容
(1)
对搜集的某市地方财政收入以及各类别收入数据,分析识别影响地方财政收入的关键属性,数据详见:
test/data/
data.csv
。
(2) 预测筛选出的关键影响因素的2014年、
2015
年的预测值。
(3) 使用关键影响因素的2014年、
2015
年的预测值得到某市地方财政收入
2014
年、
2015
年的预测值。
实验方法与步骤
(1) 将“data.csv”数据使用pandas库中的read_csv函数读入当前工作空间。
(2)
使用
scikit-learn
中的
Lasso
函数对数据进行属性选择。
(3) 使用GM(1,1)灰色预测方法得到筛选出的关键影响因素的2014年、
2015
年的预测值。
(4) 使用支持向量回归模型对某市地方财政收入进行预测。
思考与实验总结
(1) Lasso
回归如何设置合适的
l
值,在保证能够选取关键属性的前提下不过多的增加
Lasso
回归的复杂程度?
(2) 在构建SVR预测模型前使用标准差标准化对数据进行标准化处理,如使用其他标准化处理方法对结果又会造成怎么样的影响?
拓展思考
MLP多层感知器(
Multi-layerPerceptron
)是一种前向结构的人工神经网络
ANN
,映射一组输入向量到一组输出向量。
MLP
可以被看做是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元。使用
BP
反向传播算法的监督学习方法来训练
MLP
。
MLP
是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。
相对于单层感知器,MLP多层感知器输出端从一个变到了多个;输入端和输出端之间也不光只有一层,现在有两层:输出层和隐藏层,如图1-1所示。
图
1-1
多层感知器
MLP多层感知器是前馈神经网络的一个例子,一个前馈神经网络可以包含三种节点。
1) 输入节点(
Input Nodes
):也称为输入层,输入节点从外部世界提供信息。在输入节点中,不进行任何的计算,仅向隐藏节点传递信息。
2) 隐藏节点(
Hidden Nodes
):隐藏节点也称为隐藏层
,
和外部世界没有直接联系
,
这些节点进行计算,并将信息从输入节点传递到输出节点。尽管一个前馈神经网络只有一个输入层和一个输出层,但网络里可以没有也可以有多个隐藏层。
3) 输出节点(
Output Nodes
):输出节点也称为输出层,负责计算,并从网络向外部世界传递信息。
在前馈网络中,信息只单向移动
——
从输入层开始前向移动,然后通过隐藏层,再到输出层。在网络中没有循环或回路。
MLP在
80
年代的时候曾是相当流行的机器学习方法,拥有广泛的应用场景,譬如语音识别、图像识别、机器翻译等等,但自
90
年代以来,
MLP
遇到来自更为简单的支持向量机的强劲竞争。近来,由于深层学习的成功,
MLP
又重新得到了关注。
MLP拥有高度的并行处理、高度的非线性全局作用、良好的容错性、具有联想记忆功能、非常强的自适应、自学习功能等优点。但是
MLP
的网络的隐含节点个数选取非常难,停止阈值、学习率、动量常数需要采用“
trial-and-error
”法,极其耗时,学习速度慢并且容易陷入局部极值。
使用MLP算法实现对本案例的财政收入预测,并与支持向量机回归模型的预测效果进行对比。
财政收入影响因素分析及预测模型实战案例至此结束,前三篇文章链接在👇
财政收入影响因素分析及预测模型(一)
财政收入影响因素分析及预测模型(二)
财政收入影响因素分析及预测模型(三)
数据库
文章转载自
泰迪教育
,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
领墨值
有奖问卷
意见反馈
客服小墨