分享好友 最新资讯首页 最新资讯分类 切换频道
信息熵 条件熵 信息增益 信息增益比 GINI系数
2024-12-29 02:34


此文是一些机器学习常用概念的整理,搬运过来的。
另外,细节才是

在信息论与概率统计学中,熵(entropy)是一个很重要的概念。在机器学习与特征工程中,熵的概念也用得很多。

“承载了信息的东西”才是数据

  • 信息是用来消除不确定性的东西

熵是神马东东?信息论的开山祖师爷Shannon说,信息的不确定性可以用熵来表示,即信息熵是信息杂乱程度的描述
对于一个取有限个值的随机变量X,如果其概率分布为

优点

  • 1.信息增益考虑了特征出现与不出现的两种情况,比较全面,一般而言效果不错。
  • 2.使用了所有样例的统计属性,减小了对噪声的敏感度。
  • 3.容易理解,计算简单。

缺陷

  • 1.信息增益考察的是特征对整个系统的贡献,没有到具体的类别上,所以一般只能用来做全局的特征选择,而没法针对单个类别做特征选择。
  • 2.只能处理连续型的属性值,没法处理连续值的特征。
  • 3.算法天生偏向选择分支多的属性,容易导致overfitting。
最新文章
Wroadpress搭建个人博客
今天呢我将会一步步的教会你如何去搭建个人的博客用wroadpress,当然搭建博客的方法有很多种,这只是其中的一种。首先我们
提高自我价值感的17种方法
自我价值感是什么?自我价值感就是指个体看重自己,觉得自己的才能和人格受到社会重视, 在团体中享有一定的地位和声誉,并收到
揭秘SEO优化475关键因素,网站排名提升攻略
本摘要揭示了475个关键SEO优化因素,旨在提升网站排名。通过深入了解这些因素,您将掌握有效策略,助力网站在搜索引擎中脱颖而出
关于HTTPS改造的常见问题解析
对于网站安全布局来说,HTTPS成为很近比较热门的一种网站安全改善措施。今天大宝seo博客和朋友们分享的主题是关于HTTPS改造所碰
公司老板发号施令,要求员工全员实施真空上班制
近年来,随着远程办公的兴起,部分公司老板开始探索新的工作模式,其中“真空上班”便是一种新型管理方式。这种方式要求员工在不
阿里云可以做网站么/微信朋友圈推广软文
  最近碰到一个十分棘手的问题,Java程序插入空数据到oracle时报ORA-02290: 违反检查约束条件(NAMIBIAWEB.SYS_C0069731)
网站怎么被百度收录
网站被百度收录的过程主要涉及搜索引擎的爬取和索引机制。网站需要确保其内容是可访问的,搜索引擎的爬虫程序会主动访问网站。网
如何通过优化站提升百度排名-实现精准流量转化
在如今竞争激烈的互联网时代,网站优化已经成为企业和个人提升品牌曝光、获取更多流量的必由之路。而在中国市场,百度作为主流搜
SEO基础:盘点经常听到的SEO专业术语
相当大部分的新手,或者小白seo,都急于求成,在不清楚常用seo专业术语的情况下,想做要害词排名,这样的结果就是好高骛远。基础