- 在线时间
- 478 小时
- 最后登录
- 2026-4-9
- 注册时间
- 2023-7-11
- 听众数
- 4
- 收听数
- 0
- 能力
- 0 分
- 体力
- 7788 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 2922
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1171
- 主题
- 1186
- 精华
- 0
- 分享
- 0
- 好友
- 1
该用户从未签到
 |
# logistic回归2 \5 K# d9 }; B7 b; H& f% e
实际上线性最小二乘回归和Logistic回归都是广义线性模型的一个特例。当随机变量Y服从高斯分布,那么得到的是线性最小二乘回归,当随机变量服从伯努利分布,则得到的是Logistic回归。' F9 R1 s& B; F. R( l9 S( a
3 e4 s5 k3 u5 A! i7 e; k: o% n2 m$ C6 K
R软件提供了拟合计算广义线性模型的函数glm(),其命令格式如下:fitted.model <- glm(formula, family=family.generator, data=data.frame) 其中,formula是拟合公式;family是分布族,即前面讲到的广义线性模型的种类,如正态分布、Poisson分布、二项分布等。- I3 c9 _5 P, r/ o! r! M
+ f5 k/ k2 s y) A
7 y' }4 {; J! E1 v5 ]) J$ W% a5 y% D有了上面这些分布族和连接函数,我们就可以完成相应的广义线性模型的拟合问题。; {0 |$ F' W' z. l
' _1 S9 y" {- L# t& m
1)正态分布 正态分布族的使用方法: fm <- glm(formula, family=gaussian(link=identity), data=data.frame) 其中,link=identity可以不写,因为正态分布的连接函数缺省值是恒等(identity)。事实上,整个参数family=gaussian也可以不写,因为分布族的缺省值就是正态分布。 注意:正态分布的广义线性模型实际上与线性模型是相同的,也就是 fm <- glm(formula, family=gaussian, data=data.frame) 与线性模型 fm <- lm(formula, data=data.frame)有完全相同的结果,但效率却低得多。7 S" A% y T% | S+ J
, k4 ~1 u' `, u, Z: h6 Q$ e2)二项分布
7 j7 n; U3 N7 H# K0 x, B
" L: C& h. s1 J% z$ h- F. R3 d( g$ |/ b- }) c. X8 c! ]% o _
logistic回归模型是一个非线性回归模型,自变量可以是连续变量,也可以是分类变量,或哑变量。但可以使用线性回归模型对参数进行估计,所以Logistic回归模型属于广义线性模型。0 D1 n: ~4 _3 |1 w3 \0 O b
2 a2 ~% e5 h, M8 eLogistic回归模型的公式为: fm <- glm(formula, family=binomial(link=logit), data=data.frame) 其中,link=logit可以不写,因为logit是二项分布族连接函数的缺省状态。* P- v8 u6 W3 h' Y% L4 V0 f5 @
实例一、Norell实验,高压电线对牲畜的影响- #1、加载数据 u$ z3 F' o% @- S T3 x
- norell<-data.frame( x=0:5, n=rep(70,6), success=c(0,9,21,47,60,63) )/ |( j& ?' u; {: E7 V
- norell$Ymat<-cbind(norell$success, norell$n-norell$success)
$ S3 T2 a; b( T) ]: \. P s - ( a* e- D6 D, F1 ` ^( }* L7 m
- #2、建模3 v1 y6 h# b& E: `* ~5 }; ?! i: C
- glm.sol <- glm(Ymat ~ x, family=binomial, data=norell)
- {7 l) q0 f, p2 H8 u5 ^# \/ O% [6 s - 6 r8 [8 Y6 j0 q9 L
- #3、模型评估
7 E$ C5 b\" ?* z - summary(glm.sol)
复制代码- ## 0 Y/ E6 d; N. w\" o& h/ N) L
- ## Call:
. d) m7 {1 t\" ~- p, W% w - ## glm(formula = Ymat ~ x, family = binomial, data = norell)' P. X7 P4 t4 m! G4 _
- ##
, r2 M! l8 Y' w1 O - ## Deviance Residuals: 8 n4 f8 t- P# c! T% ~( c7 K
- ## 1 2 3 4 5 6
6 ~' v8 E4 K/ S& ?% q( q - ## -2.2507 0.3892 -0.1466 1.1080 0.3234 -1.6679 + [# n7 N5 ]' l
- ## * R, A' {5 b2 \/ c/ \
- ## Coefficients:
1 |6 F/ \ [5 f5 M4 c - ## Estimate Std. Error z value Pr(>|z|) # ]+ Y3 T5 w3 s2 E8 i
- ## (Intercept) -3.3010 0.3238 -10.20 <2e-16 **** N8 {- W4 U) x, }9 J- j* _
- ## x 1.2459 0.1119 11.13 <2e-16 ***+ \! S* h+ U/ o( N2 K
- ## ---
' |+ C9 o5 n7 u9 g - ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1/ k/ z8 H7 y R! f: g
- ## - l0 X9 I: o: f9 }9 z: Y
- ## (Dispersion parameter for binomial family taken to be 1)% H5 y* A9 d4 O0 Z: i
- ## ( D5 K# _- K+ H$ @- J6 c
- ## Null deviance: 250.4866 on 5 degrees of freedom
$ m0 D7 i3 T8 ?8 H% \0 }6 E2 | - ## Residual deviance: 9.3526 on 4 degrees of freedom
4 d* c/ m+ @3 m$ ]8 L( I( s - ## AIC: 34.093
* A( _; a- }% W' s# U - ##
/ s v9 I\" _! Y7 D! \ - ## Number of Fisher Scoring iterations: 4
复制代码- #与线性回归模型相同,在得到回归模型后,可以作预测:电流强度为3.5毫安时,有响应的牛的概率% E- i; F1 N( A
-
8 V2 ]0 n* _2 z( ]+ I7 o - #4、预测
`, ]\" p3 o' ]; @: ?1 Z - pre <- predict(glm.sol, data.frame(x=3.5))( W1 x# W( w# V- L/ Y
- (p <- exp(pre)/(1+exp(pre)))
复制代码- ## 1
$ E+ ?& P9 u: T* k - ## 0.742642
复制代码- #求有50%的牛响应时的电流强度:当P=0.5时,ln(P/(1-P))=0,所以X=-b0/b1
: }) s6 `6 G9 n/ M9 e5 w - glm.sol$coefficients
复制代码- ## (Intercept) x
$ x* M9 i( m/ [( U9 n - ## -3.301035 1.245937
复制代码- (X <- -glm.sol$coefficients[[1]]/glm.sol$coefficients[[2]])
复制代码- #5、画出响应比例与logistic回归曲线:
2 O; _1 l5 B6 H - d <- seq(0, 5, length=100)7 a& _* I/ p# l2 D. }4 `' h8 w# X
- pre <- predict(glm.sol, data.frame(x=d))
3 N# E* k( }3 m1 v. s\" t- p( r - p <- exp(pre)/(1+exp(pre))# b3 ^8 U9 k8 ^- M\" R
- norell$y <- norell$success/norell$n. {0 [- x! o* o- h4 f3 ?
- plot(norell$x, norell$y)/ J) [/ I: |! j8 Q5 o
- lines(d, p)
复制代码- #其中,d是给出曲线横坐标的点,pre是计算预测值,p是相应的预测概率。用plot函数和lines给出散点图和对应的预测曲线。
复制代码 " U, k( k( j* }
|
zan
|