自动化特征选择

发布时间:2024-11-22 07:02

了解自己的面部特征,化妆更显自信 #生活知识# #化妆技巧# #男性化妆技巧#

自动化特征选择

最新推荐文章于 2024-09-22 19:01:53 发布

Taohongfei_huster 于 2018-10-16 16:16:07 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

       自动化特征选择用于判断每个特征的作用,从原始数据特征中选择那些最有用的特征,通常有三种策略:单变量统计、基于模型的选择和迭代选择。下面结合cancer数据集对它们进行分析。

一、单变量统计

       在单变量统计中,我们计算每个特征和目标值之间的关系是否存在统计显著性,然后选择具有最高置信度的特征。(这些测试的一个关键性质就是它们是单变量的,即只单独考虑每个特征,如果一个特征只有在与另一个特征合并时才具有信息量,那么这个特征将被舍弃)。

       在scikit-learn中使用单变量特征选择,对于分类问题,选择f_classif,对于回归问题,选择f_regression,然后基于测试中的p值来确定一种舍弃特征的方法(所有舍弃参数的方法都使用阈值来舍弃p值过大的特征,意味着它们不可能与目标值相关)。计算阈值的方法各有不同,最简单的是SelectKBest和SelectPercentile,前者选择固定数量的k个特征,后者选择固定百分比的特征。

from sklearn.datasets import load_breast_cancer

from sklearn.feature_selection import SelectPercentile

from sklearn.model_selection import train_test_split

cancer = load_breast_cancer()

rng = np.random.RandomState(42)

noise = rng.normal(size=(len(cancer.data), 50))

X_w_noise = np.hstack([cancer.data, noise])

X_train, X_test, y_train, y_test = train_test_split(

X_w_noise, cancer.target, random_state=0, test_size=.5)

select = SelectPercentile(percentile=50)

select.fit(X_

网址:自动化特征选择 https://www.yuejiaxmz.com/news/view/187549

相关内容

五章节自动化工具选择
自我实现的人的19个特征
如何选择一个舒适的居住环境?舒适的居住环境有哪些特征?
家庭自动化选择最佳的方法
自我实现的人的15种心理特征
基于活动的出行链特征研究.doc
机器学习(一)——特征工程
自我实现量表的十个新特征,你满足几个?
环境适应特征.docx
选择适合自己的运动方式

随便看看