QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2439|回复: 0
打印 上一主题 下一主题

Scikit-learn方法使用总结

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-8-19 17:08 |只看该作者 |正序浏览
|招呼Ta 关注Ta
Scikit-learn库提供了多个方法和函数,用于数据预处理、特征工程、模型选择、训练和评估等机器学习任务。下面是对Scikit-learn中一些常用方法的总结:
  • 数据预处理方法(Preprocessing Methods):
    - H! `# s; R2 R* l2 I) l6 M4 U
  • StandardScaler:对数据进行标准化处理,使得特征的均值为0,方差为1。
  • MinMaxScaler:将数据缩放到指定的最小值和最大值之间,常用于将特征归一化到给定范围。
  • Imputer:用指定的策略(如平均值、中位数)填补缺失值。
  • OneHotEncoder:将分类特征编码为二进制的独热向量,适用于处理离散型特征。
  • LabelEncoder:将分类特征编码为连续的整数标签。
  • PolynomialFeatures:将特征集进行多项式扩展,增加非线性特征。. K2 R4 E+ @; X, R$ d4 O5 U8 b
  • 特征选择和降维方法(Feature Selection and Dimensionality Reduction Methods):; P6 T2 T9 k3 k; k+ j
  • SelectKBest:根据指定的统计测试选择k个最佳特征。
  • PCA:使用主成分分析进行特征降维。
  • RFE:递归特征消除,通过逐步删除不重要的特征来选择子集。
  • SelectFromModel:基于模型的特征选择,根据模型的重要性选择子集。
    9 \+ X. c+ M$ ^4 h& K6 n
  • 模型选择和评估方法(Model Selection and Evaluation Methods):: Y) d$ K0 ]. r% X2 D
  • train_test_split:将样本数据集划分为训练集和测试集。
  • cross_val_score:进行交叉验证评估模型性能。
  • GridSearchCV:基于网格搜索,对模型的超参数进行调优。
  • classification_report:输出分类模型的准确率、召回率、F1值等指标。
  • confusion_matrix:计算分类模型的混淆矩阵。
    8 s  V: N3 I  [' w0 Y1 R
  • 机器学习模型方法(Machine Learning Model Methods):6 `5 F6 J1 q  N
  • fit:用训练数据对模型进行训练。
  • predict:对新的数据样本进行预测。
  • score:对模型在测试数据上进行评估。
  • feature_importances_:获取模型中特征的重要性或权重。
      X4 m9 P7 G; U" h3 {  P
这些方法只是Scikit-learn库中的一部分,更多方法总结在下文的pdf中
8 }1 q4 N6 ]. ^5 P! U- L
; R, n" V2 x$ [. |9 f4 P/ {

Scikit-learn使用总结.pdf

1.22 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-12 13:21 , Processed in 0.403667 second(s), 56 queries .

回顶部