QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2201|回复: 0
打印 上一主题 下一主题

1.机器学习概念及相关术语解释

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2022-9-8 10:23 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    % t8 X  a+ k; `& ~3 n/ L) ]
    1.机器学习概念及相关术语解释
    + W5 B5 {% `  f" F
    ) c5 B9 q$ R5 A" x, w9 z' F一丶 机器学习概念# `& @- n+ P  Z! y7 _0 z3 l* V) R
    概述: 机器学习是人工智能具有智能的必要技术手段,人工智能的核心,机器学习是致力于研究如何通过CPU和GPU(图形图像处理器)的计算,利用经验或数据来改善计算机系统自身的性能( I# {+ B" H. B8 s5 L

    ( U8 u  A# v% Z总结: 机器学习模型=数据+算法% O" P' A: ^3 N$ |! N: Q2 r
    2 @! C0 P) K- r- m
    如果有新的数据,我们只需要带入到Model中就可以输出预测值0 D' q/ E) A6 j, p

    2 u- r: J% i6 x% A8 |* e- f. J! [* Y& p什么不是机器学习?
    ; f' n- ?  Q# X: X  \2 d
    ( O+ p8 \7 L7 O& A比如对于计算问题丶已经知道结果等不是机器学习问题(比如: 统计成绩搞的同学的topN). G4 i% z8 k6 V4 z/ ?
    机器学习其实就是需要有一个预测的过程' y$ s9 n8 `" i* |/ P5 B# v
    * ~7 f4 i1 Q' a: ~9 t
    机器学习概念补充:  V8 h% F" A* Y: g& n) r0 J

    ; O( @: }- }( f2 Q; K1.说明: X: 特征或属性 Y:类别标签类或预测的值
    ! W' o( s5 z5 _2 Z1 d- E8 Q" ]+ Y' q9 n6 e5 a# s
    训练集和测试集: 通常要将数据集分为两部分,训练集用来模型的训练,测试集用来模型测试模型的好坏程度.$ F( P  x. w3 G" @9 P. ~8 q3 G
    模型的好坏: 训练误差(模型预测在训练集上的Y值误差)丶测试误差(模型预测在测试集上Y值的误差)丶准确率(分对的/全部)丶错误率(1-正确率)
    + i3 I  H( }6 n8 U- i二丶两种学习方式
    ) ~1 X0 o7 n+ q. ?& z- B  j/ v基于规则的学习: 主要是通过基于专家发现的规则,指定规则,只需要新数据带入规则进行判断即可  \# P+ i5 x4 e( a7 q
    基于模型的学习: x:特征数据 --> f(函数-模型) --> Y(结果数据),基于模型就可以直接预测分析得到结果数据; \* D: R! i* ~  e/ ]8 E
    三丶术语
    ! v: A/ _( Q# R' r1 C) i0 r3 s) I3.1机器学习分类的几种概念
    / k; E" o. G3 m* T6 H7 o$ n. K. i! y
    监督学习: 训练集数据有类别标记
    4 G5 c. I, R- l$ C+ X* t: z/ i# z无监督学习:训练集数据没有类别标记9 j" ]! D6 m4 C3 g( H
    半监督学习: 有类别标记的训练集+无标记的训练集
    $ Z0 K2 P, g8 _, v$ X强化学习: 常见的应用场景包括动态系统以及机器人控制等( c/ f; t+ z6 v, j) V1 I
    监督学习:- t5 B8 m+ D) b6 Z! o& U

      `% V' g) V- ]1 E  T2 ]分类:预测值是否为连续值,不是连续值的预测的话,是分类
    , O! V4 d5 E( E7 a7 [8 }回归:预测值是连续值的话,是回归
    . [5 J6 a  w5 e8 `2 B/ m非监督学习:. W9 p0 }0 `1 ?2 x( d9 y: [5 O- z7 K

    2 P( A4 J2 S  i: z/ o& y2 g聚类:通过相似性度量,组内的相似性是极高的,组内的相异性是极高的,进行分类
    9 b, P& K; C% w6 j+ n2 h降维-通过算法进行降维的话,Z1和Z2的物理含义是不明确的1 F3 e' r9 n% z7 n
    – 特征选择: 从原有的特征中选择比较重要的特征—x1,x2,x3==>Z1,Z2# G; y# @/ y; \+ `7 V
    半监督学习:
    " h$ F. {9 e5 _; D& n! V. J# `: [$ x  q# v( ~
    1.基于聚类的假设
    ! z! g7 h* E! i$ N) Y–有类别标记的数据+没有类别标记的数据,将有类别标记的数据,去掉标签列,
    + `" D3 y; }7 x4 G5 ?; J/ U( b7 }此时所有的数据均没标签,对全部数据进行聚类,聚类之后,有类别标记的数据和没有类别标记的数据,有可能被分到不同的组或簇中,将所有的,有类别标记的数据,根据机器学习常用的处理方法–投票原则,根据少数服从多数的原则进行表决,将没有带类别标签的数据加上类别标签
    / Y& S  R( E: ?# O2.利用所有样本再进行模型训练! [7 C' z* F9 F. V6 u6 k  w  Q
    强化学习:; m9 s, t* |  A  u

    0 H' Y, S; v. ]# a解决连续决策的问题丶围棋丶无人驾驶汽车等问题: M' c- {+ ]  D4 \! n% u/ p
    3.2机器学习三要素, Y- t* F+ j7 `3 ^, S

    9 ?4 t+ }) A6 ~6 U# g5 i模型: 决策函数丶条件概率分布
    6 S! O$ Y  p& d" R算法: 解析解和最优解(梯度下降法和牛顿法)4 I6 x" T& e" W; [
    策略: (损失函数)评判一个模型的好坏; Z* y  O3 i# D
    3.3其他3 X& A# [- {# v+ _1 g6 F! U

    & H0 O% r$ r# U' B降维: 将多维数据降成低维度数据,不过降过的维度不能使用具体的物理含义表示
    9 ?  O' _3 s. S1 o6 n抽样: 有行抽样和列抽样,如果模型发生欠拟合和过拟合,可以使用抽样方法很好的解决- g. D& n* t& ], X+ ~' t& }
    交叉验证: 交叉验证就是将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证% S' Y) O" {. }
    过拟合: 模型对于训练集效果很好,对于测试集效果较差 原因:模型过于复杂$ b( a) z# C' s
    欠拟合:模型对于训练集和测试集效果都很差 原因: 模型太过简单/ {/ h$ z& d" E4 G  O/ V
    模型选择的基本原则-奥卡姆剃刀原则:在具有相同泛化误差的模型中,选择较为简单的模型,防止过拟合1 X" J( r- m* L0 H, z1 S4 j
    特征向量: 将属性或特征,通常使用向量来进行表示6 Y: `+ [/ ]0 X
    训练集: 数据集划分的一部分,来用于模型或者算法的训练/ ]1 E: V  k* E/ ?
    测试集: 数据集划分的一部分,来用于对已经训练好的模型进行测试模型的误差好坏2 e) D; m) Y' [& m' V; H5 U1 |
    4 w4 A' Z& E" l! Z8 M2 g8 c, z
    0 {& h/ s5 @# Q% L" _+ b; P
    四丶分类和回归问题
    8 M7 s* S( Q$ j4.1说明  ~8 C! v% S/ q+ k2 }" F# M1 m
    1 y. ]; [2 F6 L
    如果预测值是连续值对应的问题是回归问题) C- b" U3 b7 k- e
    如果预测值是离散值对应的问题的分类问题
    . Q- O1 {1 p% n! M& s% H& ^/ x4 p  k4.2类别型变量处理6 y( c3 _, r5 T" x! f
    比如天气: 晴天丶阴天丶雨天' R7 m! A* {5 [/ T* I* C, s; G
    lable encoder: 标签编码
    , i1 w7 T% G! `  e' [% A# I: a! M0 y! ]& C" [( ~' V
    晴天丶阴天丶雨天
    9 |! G1 A, w; b8 O; v0--------1--------2( r3 {6 I0 y0 P! ]
    * _9 P3 C! m- j/ V2 n
    ont-hot encoder: 独热编码(二进制方式)
    ! }2 y) C% a' Y3 V3 ^, H
    " o0 O$ V2 A0 r" G& g晴天 丶 阴天丶 雨天! H& {3 y0 U, h  J
    1---------0----------0
    ' u& w8 u- U4 f5 ^  M0---------1----------0
    9 b+ x+ [+ I6 \  f9 O0---------0----------1
      o# X- V3 a' d3 L" U
    7 k* b  A( N, U/ \  I7 ?7 b" H( A" F  E总结:通常使用label encoder(标签编码)
    , K2 m7 O# b1 t5 s3 @————————————————
      _2 T. L. f, {& \版权声明:本文为CSDN博主「First_____」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    & U' n: q0 t: G7 @! z) ?$ C8 u原文链接:https://blog.csdn.net/First_____/article/details/1267175232 \2 x! g! Z) O5 H8 F' o0 N

    " G/ q! y9 K. t/ B% I2 a' R0 p4 I  h! h6 W% s6 \6 s% N% E
    . p+ C, C/ n+ X8 L! C
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-17 21:31 , Processed in 0.446817 second(s), 50 queries .

    回顶部