QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2554|回复: 0
打印 上一主题 下一主题

岭回归

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-15 17:22 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
代码执行了以下操作:+ Q8 \" V1 Y2 C5 A3 S: A

/ q% y8 Q$ c/ r' w' j1.导入所需库:
  1.    import numpy as np' O) n+ u3 A. w* S' y/ g* e
  2. . o+ x/ c: D$ ]/ t0 f( R1 f
  3.    import pandas as pd3 S: j  D; ]  z/ A0 i$ c( L

  4. 2 U) s3 Z. ^3 d8 ^9 Z# I, T- d) F
  5.    import matplotlib.pyplot as plt
    4 q\" A$ f9 V; N0 \% a

  6. 8 D* w3 W/ K; S\" E  z: }8 l$ Y
  7.    from sklearn.linear_model import Ridge, RidgeCV
复制代码
2.定义源数据:
  1.    df = pd.DataFrame({
    5 P, p' \  H1 c$ h+ Y1 {
  2. + V  m& k$ @; E$ t0 K2 G
  3.        'x1': [7, 1, 11, 11, 7, 11, 3],
    ; T8 w; B* v0 h* B$ u) k% ~
  4. - t6 l6 y2 a* X$ m9 _& |( I+ s
  5.        'x2': [26, 29, 56, 31, 52, 55, 71],
    3 I! ?  y# }( q- j
  6. $ g) \8 {7 p\" ~, h\" F
  7.        'y': [78.5, 74.3, 104.3, 87.6, 95.9, 109.2, 102.7],) D! b/ G; \+ L1 x

  8. 1 a2 F3 w% A( o8 j. B9 s\" z: d
  9.    })
复制代码
创建了一个包含两个自变量(x1 和 x2)和一个因变量(y)的 DataFrame。
6 r4 O7 U3 s3 K; @. z( U! T: v  g$ R) @* E+ R; m
3.将数据转换为数组格式:
  1.    X = np.array(df[['x1', 'x2']])  # 特征集$ q( k& [5 X4 T\" X  C, Z4 t
  2. 5 S1 T- ]% s9 Z, S$ C
  3.    y = np.array(df[['y']])          # 目标集
复制代码
4.遍历不同的正则化参数 ( k ):
  1.    k_array = np.logspace(-4, 1.5, 100). |5 r# Y\" J+ {9 h% l
  2. $ g6 s3 ~7 [9 i# m1 t4 W\" g4 p( F
  3.    x1_list, x2_list = [], []6 A4 ~% y, \, J
  4. 4 t. z' W4 K7 D: }  F+ Q  M5 \
  5.    for k in k_array:
    , H8 e. t4 L! S: |1 t, z

  6. $ P9 ~3 W, j% U6 W
  7.        model = Ridge(alpha=k).fit(X, y)
    ( i. I3 o& B- o# j4 ?# l1 R2 v
  8. / }8 c. Q. d2 f% c! n! ^
  9.        x1_list.append(model.coef_[0][0]). f+ U3 a' Z0 p' I7 q! M+ Q
  10. ( b2 b( O- R- {\" T- w& I( ^
  11.        x2_list.append(model.coef_[0][1])
复制代码
遍历了一系列正则化参数 ( k ),对每个参数值使用 Ridge 回归模型拟合数据,并将得到的系数存储到 x1_list 和 x2_list 中。9 J  u$ `" w9 Y9 h( X

# g" u3 }4 L1 E5 }5.绘制岭迹图:
  1.    plt.scatter(k_array, x1_list)
  2. * U6 a' ^7 f4 [

  3. ) O2 Y. K. d# v/ u0 ^2 m
  4.    plt.scatter(k_array, x2_list)
  5. + D% }% j+ O/ {7 ]* ^0 d5 J
  6. . E9 n\\" }( J: U. y2 ]( R0 p3 |4 j
  7.    plt.plot(k_array, x1_list, label='x1')& q; i* Y2 }6 e$ q8 G9 t
  8. - S2 i: f% K+ w  @4 s% }, X\\" D
  9.    plt.plot(k_array, x2_list, label='x2')
  10. ( N: X% k; S% E1 a
  11. - R& [: b( Z# m, f2 w
  12.    plt.legend()
绘制了岭迹图,展示了不同正则化参数 ( k ) 下,系数 ( b1 ) 和 ( b2 ) 的变化趋势。; Z5 H$ s2 S! J6 y- l

) {1 `& ?9 P9 j9 R  K* Y7 `6.自动匹配最佳 ( k ) 值:
  1.    model2 = RidgeCV().fit(X, y)
复制代码
使用 RidgeCV 自动匹配最佳正则化参数 ( k ) 并拟合数据。& U+ [3 W# {% [' a5 h
  }  d$ T8 V. J
7.输出最佳模型的参数和拟合优度:
  1.    b0 = model2.intercept_[0]  # 截距( |: x2 [7 w! Q

  2. $ S; ~  _$ T3 z( ?
  3.    b1, b2 = model2.coef_[0][0], model2.coef_[0][1]  # 系数/ _\" P+ H' o# U' d+ q
  4. - b$ h7 X, @$ a
  5.    print('y = {:.4f} + {:.4f}*x1 + {:.4f}*x2'.format(b0, b1, b2))! H\" I' H' H; p8 B; L4 X4 f
  6.   {4 r( Z3 u- F2 g6 n
  7.    print('R_square =', model2.score(X, y))* y2 @\" q6 X& g7 w, m+ s

  8. + N  ~* U: {4 s- @: x
  9.    print('k =', model2.alpha_)
复制代码
输出了最佳模型的截距、系数、拟合优度以及对应的最佳正则化参数 ( k )。
. h; T5 m, o6 H! {- C通过这段代码,你可以对 Ridge 回归模型进行正则化,并选择最佳的正则化参数来提高模型的泛化能力。同时,岭迹图可以帮助你直观地观察不同正则化参数下模型系数的变化趋势。5 s- ]0 X" _8 q7 F

8 }8 q5 a$ n( n( H( j6 M# u+ K  H7 E% ~* H3 E; w

! r* R& I* |& Y* C8 p( G! f: a/ ^. F; n' T8 J2 b- l* |# {
7 x7 R+ r" j' O$ E) |$ g

12.ridge_regression.py

1.17 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-11 21:58 , Processed in 0.440401 second(s), 54 queries .

回顶部