数学建模社区-数学中国»论坛 › 【数模论坛】国家竞赛 › 全国大学生数学建模竞赛(CUMCM) › 岭回归

发新帖

查看: 2625|回复: 0

上一主题

下一主题

岭回归

字体大小: 正常放大

2744557306

1189 主题	4 听众	2934 积分

该用户从未签到

电梯直达

跳转到指定楼层

1^#

发表于 2024-3-15 17:22 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

代码执行了以下操作：

1.导入所需库：

import numpy as np
/ ^/ w: r, Y! ~% F$ k\" v: R
8 r G6 M6 Z0 k\" ?( q
import pandas as pd
) h4 a' Y8 }1 B+ `, r! N! S# ?
; s0 ^! n\" ~5 a
import matplotlib.pyplot as plt+ @5 x h\" y# y) H+ D- Y
7 {: u' n5 f2 X! A
from sklearn.linear_model import Ridge, RidgeCV

复制代码

2.定义源数据：

df = pd.DataFrame({
+ i8 Z# _8 r\" R& H% b* j2 ^9 s
' ~; F. l9 w/ z/ W: @0 w2 O9 G3 N; ~) F
'x1': [7, 1, 11, 11, 7, 11, 3],
6 M/ |$ E- m' ~3 w+ \
. d1 l9 {0 n6 A
'x2': [26, 29, 56, 31, 52, 55, 71],& ?' V& S! [( ~! d
: @$ r& k& i5 P* e
'y': [78.5, 74.3, 104.3, 87.6, 95.9, 109.2, 102.7],
! S+ ], o7 \$ H. k/ |
3 F @6 S q1 ~; ?6 e1 U; \
})

复制代码

创建了一个包含两个自变量（x1 和 x2）和一个因变量（y）的 DataFrame。

3.将数据转换为数组格式：

X = np.array(df[['x1', 'x2']]) # 特征集+ A5 P, b) g) \9 h
- u [2 A7 J. B: B( P1 q
y = np.array(df[['y']]) # 目标集

复制代码

4.遍历不同的正则化参数 ( k )：

k_array = np.logspace(-4, 1.5, 100)
$ a% a N2 p' z0 M2 R/ e9 G' ?
% m6 R3 X$ n) C1 @$ ?
x1_list, x2_list = [], []# r: A6 V1 Q! R+ r
3 H( P- G/ H2 R- O& S \
for k in k_array:\" T$ M& Q( ~8 R( ]1 j\" K
2 }\" G5 ~2 R( ~' q
model = Ridge(alpha=k).fit(X, y)0 ^8 P2 }) z8 O! q5 P* j6 }
1 A0 g) W$ q2 v
x1_list.append(model.coef_[0][0])8 j% Z9 P2 }( g E
, H( q# p1 A9 W
x2_list.append(model.coef_[0][1])

复制代码

遍历了一系列正则化参数 ( k )，对每个参数值使用 Ridge 回归模型拟合数据，并将得到的系数存储到 x1_list 和 x2_list 中。

5.绘制岭迹图：

plt.scatter(k_array, x1_list)
* `- [$ j6 _) L# d) l
& Y/ o8 G# d\\" m! [
plt.scatter(k_array, x2_list)
2 L% F/ {+ s7 H4 c5 r8 g( q2 v) F
& w\\" U6 s! t/ Z* \# B R/ u
plt.plot(k_array, x1_list, label='x1')( X x6 P* `; c+ ^ {9 D( ?3 h% a
, e6 U+ X4 c' K; |. ~% t
plt.plot(k_array, x2_list, label='x2')
6 ~. R4 j' Y. I! G' s0 a
4 Y( D. A) l2 l5 C7 S
plt.legend()

绘制了岭迹图，展示了不同正则化参数 ( k ) 下，系数 ( b1 ) 和 ( b2 ) 的变化趋势。

6.自动匹配最佳 ( k ) 值：

model2 = RidgeCV().fit(X, y)

复制代码

使用 RidgeCV 自动匹配最佳正则化参数 ( k ) 并拟合数据。

7.输出最佳模型的参数和拟合优度：

b0 = model2.intercept_[0] # 截距
+ |; O8 q\" ~3 E% s# F3 x1 q( {2 U6 [
& u% _+ T& J\" ~
b1, b2 = model2.coef_[0][0], model2.coef_[0][1] # 系数5 l% s1 w9 u' m. K
0 l& ]2 T3 R\" {
print('y = {:.4f} + {:.4f}*x1 + {:.4f}*x2'.format(b0, b1, b2))% A; `4 [\" j2 I* j
8 c/ \' z1 t1 L, O7 {, R9 N' ?
print('R_square =', model2.score(X, y))
& o* n5 g9 k7 [
6 O( a8 j* B) L. p9 ?4 l
print('k =', model2.alpha_)

复制代码

输出了最佳模型的截距、系数、拟合优度以及对应的最佳正则化参数 ( k )。
通过这段代码，你可以对 Ridge 回归模型进行正则化，并选择最佳的正则化参数来提高模型的泛化能力。同时，岭迹图可以帮助你直观地观察不同正则化参数下模型系数的变化趋势。

12.ridge_regression.py

1.17 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力 [记录] [购买]

zan

转播0 淘帖0 分享0 收藏0 支持0 反对0 微信

回复

使用道具举报

发新帖

qq

电话咨询
04714969085

fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务|

手机版|Archiver| |繁體中文手机客户端

蒙公网安备 15010502000194号

Powered by Discuz! X2.5 © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 ) 论坛法律顾问：王兆丰

GMT+8, 2026-7-10 06:56 , Processed in 0.453260 second(s), 55 queries .

回顶部