QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2769|回复: 0
打印 上一主题 下一主题

房价预测(线性回归)

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-31 16:37 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
数据集:使用加利福尼亚房价数据集。
# u. }. k& w& s7 h) K6 ?" p4 y' u任务:构建一个模型预测加利福尼亚地区的房价。
4 n) e9 D, v% T挑战:尝试不同的预处理方法(标准化、归一化等)和特征选择技术来改进模型性能。: @9 H, g* Q( T1 c3 u% q# Q8 H
线性回归是一种预测数值型数据的经典统计方法,它假设目标值和特征之间存在线性关系。在房价预测任务中,我们可以使用线性回归模型来预测基于多个特征(如房屋大小、位置、年龄等)的房价。以下是使用加利福尼亚房价数据集进行房价预测的示例代码,以及如何应用不同的预处理方法和特征选择技术来改进模型性能。
, S  E% {7 o' Z( s& R. n9 P" G; S: ~9 S! W% h! R) [* S
加载和预处理数据
; C: b( }9 k4 F4 Q' S) V首先,我们从scikit-learn中加载加利福尼亚房价数据集,并进行基本的数据预处理。
  1. from sklearn.datasets import fetch_california_housing1 c7 v8 q- G% \0 W5 k2 Q! _
  2. 4 h9 ~5 _% l; f7 w
  3. from sklearn.model_selection import train_test_split
  4. 1 q# Z9 `/ n! {

  5. - U& ~- _$ |4 i0 K3 r
  6. from sklearn.preprocessing import StandardScaler
  7. 7 L2 j2 a8 P8 I9 R. @- X: _+ X- ~/ _! C4 y

  8. 3 Y# A/ n; y7 J6 p4 @6 I6 v7 m
  9. from sklearn.linear_model import LinearRegression
  10. : s, m\\" [. p4 M% w. e3 B
  11. 1 G  i# J0 F( R( F3 @
  12. from sklearn.metrics import mean_squared_error, ^' }/ f1 B; l6 Y7 V4 C/ |8 y/ [
  13. 9 b' Z& o' F  \' u6 r' o7 K

  14. 2 U( i! @\\" m. O0 o$ e& ?

  15. 1 @1 R7 o: U1 T: j& n: o% |
  16. # 加载数据集  p( Z\\" A0 X) i- p+ F& u
  17. 4 {- S) A) t( N; _5 H1 v6 L7 |
  18. housing = fetch_california_housing()+ s8 K9 Z, ]) q$ V
  19. 4 n% r( l2 ~0 b; N# w4 E* y
  20. X, y = housing.data, housing.target
  21. ( b& x8 O* ?2 p# n\\" H# }% m

  22. ! |7 W9 D4 B9 t
  23. , h2 C% O* F\\" {# W! K- Q

  24. & M/ }, j; Q+ p8 B
  25. # 划分训练集和测试集
  26. . |- i4 w+ ~. n4 T* t. K/ b
  27. 2 d* v8 J: r; |* x7 p
  28. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
  29. 1 E( a8 j) E8 j$ U6 n* o

  30. 6 S# q/ ?# [\\" I% _
  31. ; x1 u) A; J# Z/ g2 {+ W
  32. \\" x; H0 v. P& y
  33. # 数据预处理:标准化8 k5 x. ?5 q6 i( K\\" h7 |# d
  34. 9 T' [  D! X! @) J, `
  35. scaler = StandardScaler()
  36. \\" h+ D+ c- }- |- @/ |5 o( \
  37. 9 U# l+ c7 w- s: Y* y
  38. X_train_scaled = scaler.fit_transform(X_train)
  39. 2 @: l; z2 o9 X$ V  }$ h! O. G
  40. 5 G6 R: y' ?+ s( p/ U/ B
  41. X_test_scaled = scaler.transform(X_test)
构建和训练线性回归模型
  1. # 创建线性回归模型
    - d# r\" w9 L6 ?\" A8 _\" X
  2. model = LinearRegression()8 v0 W7 n7 }# \& t
  3.   X; h/ [: A0 w- v! z
  4. # 训练模型
    / |. J! X& J0 q0 v: b, {1 ?
  5. model.fit(X_train_scaled, y_train)
    2 e/ n7 q3 m7 ?: Q3 q1 u
  6. $ Q6 Z( D7 S4 t* n/ i& O
  7. # 预测测试集
    \" l9 h# l\" ^6 ]3 u% p3 ~9 z
  8. y_pred = model.predict(X_test_scaled)
    7 x) N! X5 |. D7 J1 f( B6 `
  9. ' D1 o5 _1 g& k% X3 a$ s
  10. # 评估模型* ?2 `: m4 P% f- C6 g8 V
  11. mse = mean_squared_error(y_test, y_pred)
    : P5 B/ a) Q% E6 E! |# S$ b
  12. print(f"Mean Squared Error: {mse}")
复制代码
挑战:尝试不同的预处理方法和特征选择( r- T  n0 G; r
预处理方法:除了标准化,你还可以尝试归一化(MinMaxScaler)、对数转换等方法,看看它们如何影响模型的性能。
( A  {$ v; M/ g9 n特征选择:可以使用不同的特征选择方法(如SelectKBest, SelectFromModel)来选择最有影响力的特征,这有助于模型专注于最重要的信息,提高预测准确性。
  1. from sklearn.feature_selection import SelectKBest, f_regression, Z3 a; I# G+ A/ O0 }! q
  2. & L4 l/ B* e0 K7 R1 `\" J& l
  3. # 特征选择
    7 ^3 B8 o# ~3 c
  4. selector = SelectKBest(score_func=f_regression, k=5). }: v8 |9 d3 U5 D\" s8 u
  5. X_train_selected = selector.fit_transform(X_train_scaled, y_train)
    9 }, V' i; V3 P
  6. X_test_selected = selector.transform(X_test_scaled)6 k! \\" {. s% v

  7. ' o0 p1 q( ?+ a/ q8 H  N( H
  8. # 使用选择的特征重新训练模型* \1 P* w' a3 T  j
  9. model.fit(X_train_selected, y_train)
    ( T- o. U( p8 x( A  X+ d+ m, k
  10. y_pred_selected = model.predict(X_test_selected)# E( e4 m! U1 p3 Q
  11. $ i0 S! ~5 n\" _: A  F4 c
  12. # 评估- C+ c+ h. B4 R1 J
  13. mse_selected = mean_squared_error(y_test, y_pred_selected)
    ( w0 S' `- X( [. V* Q# P
  14. print(f"Mean Squared Error with selected features: {mse_selected}")
复制代码

) k2 P& Z3 B: a, Y/ k8 p
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-16 17:14 , Processed in 0.427559 second(s), 51 queries .

回顶部