暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

半朴素贝叶斯分类器

云南高校数据化运营管理工程中心 2019-05-01
466

目录






  1. 为什么需要半朴素贝叶斯分类器

  2. 如何确定依赖






编辑:

校对:

版本:

zhang

zhang

python3

朴素贝叶斯

在朴素的分类中,我们假定了各个属性之间的独立,这是为了计算方便,防止过多的属性之间的依赖导致的大量计算。这正是朴素的含义。

基于朴素贝叶斯分类的原理如下:




为什么需要半朴素贝叶斯分类器

虽然朴素贝叶斯的分类效果不错,但是属性之间毕竟是有关联的,某个属性依赖于另外的属性,于是就有了半朴素贝叶斯分类器。简单总结如下:

1:后验概率P(ck|x)计算起来比较困难。

2:属性条件独立性假设在现实任务中往往很难成立。

为了计算量不至于太大,假定每个属性只依赖另外的一个。为了可以准确描述真实情况,公式就变成:

其中, (0.3) 是贝叶斯定理, (0.4) 是因为分母的概率 p(x)与我们关心的类没有关系(这里符号 ∝ 是 “成比例” 的意思), 而 (0.5) 是因为假定了 观测值 x1,x2,...,xn在给定了ck的条件独立性.


如何确定依赖

1.SOPDE方法。这种方法是假定所有的属性都依赖于共同的一个父属性。

2.TAN方法。每个属性依赖的另外的属性由最大带权生成树来确定。

(1)先求每个属性之间的互信息来作为他们之间的权值。

(2)构件完全图。权重是刚才求得的互信息。然后用最大带权生成树算法求得此图的最大带权的生成树。

(3)找一个根变量,然后依次将图变为有向图。

(4)添加类别y到每个属性的的有向边。




思考——学而不思则罔

那如何使用python来实现贝叶斯分类呢?先尝试一下吧,我们下次进行代码演示。


理解编程语言,探索数据奥秘

每日练习|干货分享|新闻资讯|公益平台。

每天学习一点点,你将会见到全新的自己。

长按识别二维码关注


文章转载自云南高校数据化运营管理工程中心,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论