python实现信息熵的计算代码
python实现信息熵的计算代码
1、什么是信息熵?
1948年香农提出了信息熵(Entropy)的概念。
信息理论:
1、从信息的完整性上进行的描述:
当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
2、从信息的有序性上进行的描述:
当数据量一致时,系统越有序,熵值越低;系统越混乱或者分散,熵值越高。
“信息熵”(informationentropy)是度量样本集合纯度最常用的一种指标。
二、python实现信息熵的计算代码
1、导入库
importnumpyasnp
importpandasaspd
2、准备数据
data=pd.DataFrame(
{'学历':['专科','专科','专科','专科','专科','本科','本科','本科','本科','本科',
'研究生','研究生','研究生','研究生','研究生'],
'婚否':['否','否','是','是','否','否','否','是','否','否','否','否','是','是','否'],
'是否有车':['否','否','否','是','否','否','否','是','是','是','是','是','否','否',
'否'],
'收入水平':['中','高','高','中','中','中','高','高','很高','很高','很高','高','高',
'很高','中'],
'类别':['否','否','是','是','否','否','否','是','是','是','是','是','是','是','否']})
3、定义信息熵函数
#定义计算信息熵的函数:计算Infor(D)
definfor(data):
a=pd.value_counts(data)/len(data)
returnsum(np.log2(a)*a*(-1))
4、数据测试
#print(infor(data["学历"]))#测试结果为:1.584962500721156
以上就是python实现信息熵的计算代码,希望能对大家有所帮助。更多Python学习教程请关注IT培训机构:千锋教育。
猜你喜欢LIKE
相关推荐HOT
更多>>python日志记录器的配置
python日志记录器的配置Logger对象有三个任务。第一,它们将一些方法暴露给应用程序代码,使应用程序能够在运行时记录消息。第二,记录器对象将...详情>>
2023-11-14 20:38:29pythonvlookup函数功能是什么?
python中vlookup函数功能是什么?exce中的vlookup功能非常强大和方便。但总是手动操作,终究还是效率不高。在VBA,将一系列人工操作改为一键操作...详情>>
2023-11-14 16:51:57pythonpathlib模块的用法有哪些?
python中pathlib模块的用法有哪些?在这个世界上,人们每天都在用Python完成着不同的工作。而文件操作,则是大家最常需要解决的任务之一。使用Py...详情>>
2023-11-14 16:29:17python内置方法的汇总整理
python内置方法的汇总整理1、replace替换后是需要用另一种数据类型接受的数据。m=n.replace(“0b”,"")替换m中0b为“空“变量名.replace(“要替...详情>>
2023-11-14 15:53:51热门推荐
python中string和float之间的转换
沸python中UDP编程实现通信
热python中如何使用numpy.zeros()函数?
热python中子类与父类的关系
新python中泊松分布是什么意思?
python实现信息熵的计算代码
python日志记录器的配置
python如何对Python数据表进行检查
python基于LBPH的人脸识别操作
python中列表的索引如何理解?
python的id函数如何判断分片产生的列表?
python如何使用append函数扩展列表?
python如何实现信息增益和信息增益率
python使用import调用模块