QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2478|回复: 0
打印 上一主题 下一主题

Scikit-learn方法使用总结

[复制链接]
字体大小: 正常 放大

1188

主题

4

听众

2931

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-8-19 17:08 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
Scikit-learn库提供了多个方法和函数,用于数据预处理、特征工程、模型选择、训练和评估等机器学习任务。下面是对Scikit-learn中一些常用方法的总结:
  • 数据预处理方法(Preprocessing Methods):" `4 {2 h% @8 ^: y% ^
  • StandardScaler:对数据进行标准化处理,使得特征的均值为0,方差为1。
  • MinMaxScaler:将数据缩放到指定的最小值和最大值之间,常用于将特征归一化到给定范围。
  • Imputer:用指定的策略(如平均值、中位数)填补缺失值。
  • OneHotEncoder:将分类特征编码为二进制的独热向量,适用于处理离散型特征。
  • LabelEncoder:将分类特征编码为连续的整数标签。
  • PolynomialFeatures:将特征集进行多项式扩展,增加非线性特征。
    ! _8 ?0 \+ w, \7 y
  • 特征选择和降维方法(Feature Selection and Dimensionality Reduction Methods):5 G. z/ R8 q' P- q4 g. u4 L. H
  • SelectKBest:根据指定的统计测试选择k个最佳特征。
  • PCA:使用主成分分析进行特征降维。
  • RFE:递归特征消除,通过逐步删除不重要的特征来选择子集。
  • SelectFromModel:基于模型的特征选择,根据模型的重要性选择子集。
    # y3 M% K7 ]: X( a, I* L& E  c
  • 模型选择和评估方法(Model Selection and Evaluation Methods):/ H$ X9 v3 |4 T
  • train_test_split:将样本数据集划分为训练集和测试集。
  • cross_val_score:进行交叉验证评估模型性能。
  • GridSearchCV:基于网格搜索,对模型的超参数进行调优。
  • classification_report:输出分类模型的准确率、召回率、F1值等指标。
  • confusion_matrix:计算分类模型的混淆矩阵。+ A* J  [+ N. l' I& x+ L" T
  • 机器学习模型方法(Machine Learning Model Methods):
    + \5 x; I/ P6 B8 {
  • fit:用训练数据对模型进行训练。
  • predict:对新的数据样本进行预测。
  • score:对模型在测试数据上进行评估。
  • feature_importances_:获取模型中特征的重要性或权重。
    2 h4 L8 C: {* G
这些方法只是Scikit-learn库中的一部分,更多方法总结在下文的pdf中

& B/ o- g$ J- W$ I5 v1 F+ |7 W; o- ^2 M- M& Y/ a6 f

Scikit-learn使用总结.pdf

1.22 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-5-25 16:48 , Processed in 0.490858 second(s), 55 queries .

回顶部