数学建模社区-数学中国»论坛 › 【数模论坛】国家竞赛 › 全国大学生数学建模竞赛(CUMCM) › Scikit-learn方法使用总结

发新帖

查看: 2514|回复: 0

上一主题

下一主题

Scikit-learn方法使用总结

字体大小: 正常放大

2744557306

1189 主题	4 听众	2934 积分

该用户从未签到

电梯直达

跳转到指定楼层

1^#

发表于 2023-8-19 17:08 |只看该作者 |正序浏览

|招呼Ta 关注Ta

Scikit-learn库提供了多个方法和函数，用于数据预处理、特征工程、模型选择、训练和评估等机器学习任务。下面是对Scikit-learn中一些常用方法的总结：

数据预处理方法（Preprocessing Methods）：! Q+ B7 ^% i- a. a( f; E4 Q

StandardScaler：对数据进行标准化处理，使得特征的均值为0，方差为1。
MinMaxScaler：将数据缩放到指定的最小值和最大值之间，常用于将特征归一化到给定范围。
Imputer：用指定的策略（如平均值、中位数）填补缺失值。
OneHotEncoder：将分类特征编码为二进制的独热向量，适用于处理离散型特征。
LabelEncoder：将分类特征编码为连续的整数标签。
PolynomialFeatures：将特征集进行多项式扩展，增加非线性特征。
, B1 q# }: m& R# Q

特征选择和降维方法（Feature Selection and Dimensionality Reduction Methods）：7 h8 w6 ^5 h. R- z9 |6 y/ c

SelectKBest：根据指定的统计测试选择k个最佳特征。
PCA：使用主成分分析进行特征降维。
RFE：递归特征消除，通过逐步删除不重要的特征来选择子集。
SelectFromModel：基于模型的特征选择，根据模型的重要性选择子集。; |$ _0 A) ~( g/ S; t! I* x- j4 X

模型选择和评估方法（Model Selection and Evaluation Methods）：# S$ N" @# B# g8 k3 D

train_test_split：将样本数据集划分为训练集和测试集。
cross_val_score：进行交叉验证评估模型性能。
GridSearchCV：基于网格搜索，对模型的超参数进行调优。
classification_report：输出分类模型的准确率、召回率、F1值等指标。
confusion_matrix：计算分类模型的混淆矩阵。3 F0 H0 ~- F. z& l; L+ R2 _, Q; J

机器学习模型方法（Machine Learning Model Methods）：0 N* N- S7 }7 s" D8 a" l/ F. g

fit：用训练数据对模型进行训练。
predict：对新的数据样本进行预测。
score：对模型在测试数据上进行评估。
feature_importances_：获取模型中特征的重要性或权重。
) O; \* h6 z7 @; i2 s) I, G0 V7 V- {

这些方法只是Scikit-learn库中的一部分，更多方法总结在下文的pdf中

Scikit-learn使用总结.pdf

1.22 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力 [记录] [购买]

zan

转播0 淘帖0 分享0 收藏0 支持0 反对0 微信

回复

使用道具举报

发新帖

qq

电话咨询
04714969085

fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务|

手机版|Archiver| |繁體中文手机客户端

蒙公网安备 15010502000194号

Powered by Discuz! X2.5 © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 ) 论坛法律顾问：王兆丰

GMT+8, 2026-8-1 06:18 , Processed in 0.309967 second(s), 56 queries .

回顶部