python特征生成是什么?
python特征生成是什么?
业内常说数据决定了模型效果的上限,机械学习算法通过数据特征进行预测,良好的特征可以显着提高模型效果。这意味着通过特征生成(即从数据设计中加工模型的可用特征)是特征工程的重要一步。
一、特征生成作用
1、增加特征的表达能力,提升模型效果;
(如体重除以身高就是表达健康情况的重要特征,而单纯看身高或体重对健康情况表达就有限。)
2、可以融入业务上的理解设计特征,增加模型的可解释性。
二、特征生成方法
1、聚合方式
对存在一对多的字段,将其对应多条记录分组聚合后统计平均值、计数、值等数据特征。
#自定义分组聚合统计函数
defx2_sum(group):
returnsum(group**2)
df.groupby('cust_no').C1.apply(x2_sum)
2、转换方式
对字段间做加减乘除等运算生成数据特征的过程,对不同字段类型有不同转换方式。
以上就是python特征生成是什么,希望能对大家有所帮助,更多Python学习教程请关注IT培训机构:千锋教育。
相关推荐HOT
更多>>python正则表达式中的零宽断言
python正则表达式中的零宽断言1、概念有些元字符不匹配任何字符,只是简单的表示成功或失败,所以这些字符也叫零宽断言。2、符号举例(1)|或操作...详情>>
2023-11-14 11:35:03python方法的绑定和未绑定
python方法的绑定和未绑定1、说明未绑定对象的方法:无self参数的方法,通过定义类调用函数,返回未绑定self的方法。绑定对象的方法:带self参...详情>>
2023-11-14 09:53:02python海象运算符的使用
python海象运算符的使用1、在判断条件下允许操作。在一定程度上简化了代码,但降低了可读性。i=len((l:=[1,2,3]))#先对l进行赋值,在对i赋值whi...详情>>
2023-11-14 02:38:21pythonelif语句报错是什么原因
python的else和elif语句也可以叫做子句,因为它们不能独立使用,两者都是出现在if、for、while语句内部的。else子句可以增加一种选择;而elif子...详情>>
2023-11-13 21:46:35