QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2490|回复: 0
打印 上一主题 下一主题

Scikit-learn方法使用总结

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-8-19 17:08 |只看该作者 |正序浏览
|招呼Ta 关注Ta
Scikit-learn库提供了多个方法和函数,用于数据预处理、特征工程、模型选择、训练和评估等机器学习任务。下面是对Scikit-learn中一些常用方法的总结:
  • 数据预处理方法(Preprocessing Methods):9 W6 M. s+ D- G7 N
  • StandardScaler:对数据进行标准化处理,使得特征的均值为0,方差为1。
  • MinMaxScaler:将数据缩放到指定的最小值和最大值之间,常用于将特征归一化到给定范围。
  • Imputer:用指定的策略(如平均值、中位数)填补缺失值。
  • OneHotEncoder:将分类特征编码为二进制的独热向量,适用于处理离散型特征。
  • LabelEncoder:将分类特征编码为连续的整数标签。
  • PolynomialFeatures:将特征集进行多项式扩展,增加非线性特征。
    : @$ @3 P6 s' i5 L; R
  • 特征选择和降维方法(Feature Selection and Dimensionality Reduction Methods):
    * ]0 Y" w1 Y; J. G" a- z" F3 S- w
  • SelectKBest:根据指定的统计测试选择k个最佳特征。
  • PCA:使用主成分分析进行特征降维。
  • RFE:递归特征消除,通过逐步删除不重要的特征来选择子集。
  • SelectFromModel:基于模型的特征选择,根据模型的重要性选择子集。
    " `9 W7 P8 W3 T/ a0 I
  • 模型选择和评估方法(Model Selection and Evaluation Methods):# `6 t# U6 B8 M" h* P) ?2 F1 X
  • train_test_split:将样本数据集划分为训练集和测试集。
  • cross_val_score:进行交叉验证评估模型性能。
  • GridSearchCV:基于网格搜索,对模型的超参数进行调优。
  • classification_report:输出分类模型的准确率、召回率、F1值等指标。
  • confusion_matrix:计算分类模型的混淆矩阵。9 M8 N6 D" H: s2 X" l  [4 H
  • 机器学习模型方法(Machine Learning Model Methods):1 Z* W) D9 y( X8 H0 w2 s2 c
  • fit:用训练数据对模型进行训练。
  • predict:对新的数据样本进行预测。
  • score:对模型在测试数据上进行评估。
  • feature_importances_:获取模型中特征的重要性或权重。3 S/ z: F: f, }, R3 ]7 x
这些方法只是Scikit-learn库中的一部分,更多方法总结在下文的pdf中
2 C# @4 m" n' L- Z/ `& T2 j

. O" w2 b2 @8 [! C7 E

Scikit-learn使用总结.pdf

1.22 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-14 07:19 , Processed in 0.422790 second(s), 55 queries .

回顶部