QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1792|回复: 0
打印 上一主题 下一主题

Scikit-learn方法使用总结

[复制链接]
字体大小: 正常 放大

1175

主题

4

听众

2803

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-8-19 17:08 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
Scikit-learn库提供了多个方法和函数,用于数据预处理、特征工程、模型选择、训练和评估等机器学习任务。下面是对Scikit-learn中一些常用方法的总结:
  • 数据预处理方法(Preprocessing Methods):
    3 \/ C  E* w( i" R5 R  y
  • StandardScaler:对数据进行标准化处理,使得特征的均值为0,方差为1。
  • MinMaxScaler:将数据缩放到指定的最小值和最大值之间,常用于将特征归一化到给定范围。
  • Imputer:用指定的策略(如平均值、中位数)填补缺失值。
  • OneHotEncoder:将分类特征编码为二进制的独热向量,适用于处理离散型特征。
  • LabelEncoder:将分类特征编码为连续的整数标签。
  • PolynomialFeatures:将特征集进行多项式扩展,增加非线性特征。& Z' J+ l+ V$ k* d9 g) }
  • 特征选择和降维方法(Feature Selection and Dimensionality Reduction Methods):) y: X3 J) h) `8 k, `; x
  • SelectKBest:根据指定的统计测试选择k个最佳特征。
  • PCA:使用主成分分析进行特征降维。
  • RFE:递归特征消除,通过逐步删除不重要的特征来选择子集。
  • SelectFromModel:基于模型的特征选择,根据模型的重要性选择子集。
    / Y- C1 ~" |2 c) t7 i6 I
  • 模型选择和评估方法(Model Selection and Evaluation Methods):
    1 G* \1 D/ p) t& G2 n2 Q# B- y
  • train_test_split:将样本数据集划分为训练集和测试集。
  • cross_val_score:进行交叉验证评估模型性能。
  • GridSearchCV:基于网格搜索,对模型的超参数进行调优。
  • classification_report:输出分类模型的准确率、召回率、F1值等指标。
  • confusion_matrix:计算分类模型的混淆矩阵。
    " i/ G" }6 p! R9 }. ~0 t
  • 机器学习模型方法(Machine Learning Model Methods):
    7 B' Q* Z, V& f6 J  b, \
  • fit:用训练数据对模型进行训练。
  • predict:对新的数据样本进行预测。
  • score:对模型在测试数据上进行评估。
  • feature_importances_:获取模型中特征的重要性或权重。
    5 C  C) r# C5 ?/ v7 k$ i# g
这些方法只是Scikit-learn库中的一部分,更多方法总结在下文的pdf中

* Q; \/ D4 B! l- v+ t
9 K. D! K2 g. \* V, M" T6 d: S- l9 d

Scikit-learn使用总结.pdf

1.22 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2025-7-3 22:13 , Processed in 0.512550 second(s), 54 queries .

回顶部