QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2721|回复: 0
打印 上一主题 下一主题

偏最小二乘回归分析

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-11-30 16:59 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
偏小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用偏小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。
% f7 B+ e1 K" \- ^5 r& x/ {偏小二乘回归分析在建模过程中集中了主成分分析,典型相关分析和线性回归分析方法的特点,因此在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研究内容,提供更丰富、深入的一些信息。
  1. import numpy as np8 g+ g8 J' q  k- q
  2. from sklearn.cross_decomposition import PLSRegression
  3. , i& u/ f+ \* N
  4. from sklearn.preprocessing import StandardScaler
  5. 0 j% _# h. M) S\\" K$ s4 `1 B
  6. import matplotlib.pyplot as plt# R6 X1 S6 G& G' U, [* u

  7. , c  f# x4 y7 l2 {4 R
  8. # 原始数据,自变量X和因变量y6 R! L6 E! N( L: P9 X
  9. X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]), t' L\\" r# W: `
  10. y = np.array([1, 2, 3, 4])2 T+ ^1 D  K, W
  11. # ^6 e% b\\" T6 F: Y+ @0 {
  12. # 对自变量进行标准化处理
  13. # y( n+ Z# ^! `, g+ e0 a, H$ N
  14. scaler = StandardScaler()9 h, {0 ]9 ?; y% W% ?+ ]8 i
  15. X_scaled = scaler.fit_transform(X)
  16. 6 X0 Q  Y' k/ S% [2 P6 k

  17. 5 f1 a; n; o- i  @/ w; |) g! \
  18. # 创建PLSRegression对象,并指定主成分个数为2\\" _9 x' f2 ]5 k8 Y
  19. pls = PLSRegression(n_components=2). x: |0 G) `+ n* L/ D: m

  20. 7 q  a/ ^% W. @* f
  21. # 进行偏最小二乘回归分析
  22. 6 Y0 U$ v: o2 s
  23. pls.fit(X_scaled, y)/ i- t5 j( P! Y/ N. R
  24. 4 [3 z( X+ n' T
  25. # 获得预测值7 k7 \+ p7 [: ]\\" t, _) r/ d2 S
  26. y_pred = pls.predict(X_scaled)$ b. O' [* p, `) u3 C0 X6 N

  27. & A7 `\\" s! A- ~, h
  28. # 绘制原始数据和预测值
  29. / R4 ?1 R1 M3 R8 U! f8 e
  30. plt.figure(figsize=(8, 6))
  31. 4 x- I: |0 H: e% x+ a
  32. plt.scatter(y, y_pred, c='b', label='Predicted vs. Observed')
  33. # r( m* k4 o9 @9 p6 r\\" n$ n
  34. plt.plot([min(y), max(y)], [min(y), max(y)], 'k--', lw=2, label='Perfect Fit')) Z2 x% o' Q+ e& Q5 X, B
  35. plt.xlabel('Observed')
  36. + U0 V; }\\" k( d) k; v\\" c, {* v2 u/ |
  37. plt.ylabel('Predicted')
  38. # ?* H0 J  [: U/ {5 n3 n6 D
  39. plt.title('PLS Regression')
  40. . J4 N# }3 m4 |2 u, N
  41. plt.legend()
  42. / ^+ ]1 Q4 V2 Y2 ^
  43. plt.grid(True): Y7 [: C0 x4 q: w. w
  44. plt.show(), t( c2 V' e% Z- s7 F0 x* z

  45. * W\\" c1 q) X- D4 [( |1 k1 p7 j9 T
在上述代码中,我们首先定义了原始数据矩阵X和因变量向量y,然后创建了一个PLSRegression对象并指定保留的主成分个数为2。接下来,使用fit()方法进行偏最小二乘回归分析,并使用coef_属性获取回归系数。最后,使用predict()方法对原始数据进行预测,并获得预测值y_pred。请根据实际情况调整原始数据和保留的主成分个数,并根据需要对结果进行解释和分析。
4 S# `! b& I+ e( Z1 ?1 b7 M& h运行上述代码,将绘制散点图来展示观察值(原始数据)与预测值之间的关系。如果模型拟合良好,散点图中的点应该基本落在对角线上。如果点主要集中在对角线上方,则预测值高估了观察值;如果点主要集中在对角线下方,则预测值低估了观察值。在理想情况下,所有点都应该在对角线上。
8 J5 V, Y2 G1 G. ]- q; m0 o VeryCapture_20231130164832.jpg
1 X: ~9 [* N+ i' z- [6 n4 ~. l2 V; b, i$ G" r6 K, _& Z

3 G) i1 [6 d( F- K  E1 l
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-14 21:58 , Processed in 0.327867 second(s), 53 queries .

回顶部