- 在线时间
- 27 小时
- 最后登录
- 2013-5-20
- 注册时间
- 2012-11-2
- 听众数
- 15
- 收听数
- 1
- 能力
- 0 分
- 体力
- 3870 点
- 威望
- 0 点
- 阅读权限
- 60
- 积分
- 1335
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 347
- 主题
- 320
- 精华
- 0
- 分享
- 0
- 好友
- 6
升级   33.5% TA的每日心情 | 奋斗 2013-6-15 16:58 |
---|
签到天数: 24 天 [LV.4]偶尔看看III
 群组: 第四届数学中国美赛实 |
因子(factor)和有序因子(ordered factor) 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。, t/ m( [3 R$ K3 F
因子表示分类变量,有序因子表示有序变量。' h0 n4 N8 r# s, h5 _. s
生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的5 X& p9 X# b* F4 b2 ]
2 U. a& ]' ?6 B' u, v1 X* Q; q标签向量。
: F6 O7 g: W4 u* D) ]! y9 ~+ `8 G1、创建一个因子。
' { I! k2 o- M* n5 l# j7 } 例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')
7 ]% a4 i+ S9 U2 V6 p) Y, H/ z' gcol <- factor(colour)
5 N# [0 d8 q; {$ acol1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容/ C. A' A# U1 Y
col2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3'))1 n" ^; S; J3 t, q: p
col_vec <- as.vector(col2) #转换成字符向量5 q' G! M+ L {# N5 G, h+ q% Z
col_num <- as.numeric(col2) #转换成数字向量 Z& S, l' K6 }& p" A4 @- i* K
col3 <- factor(colour, levels = c('G', 'R'))
4 M; ?3 N- q4 z/ k5 U
- v% f; h/ y* w. L3 @2 }' G, X/ M6 k2、创建一个有序因子。8 z6 O& W3 Y2 |+ s. v
例1:score <- c('A', 'B', 'A', 'C', 'B')
4 z% e; l, \+ p. b9 j* e0 C6 Tscore1 <- ordered(score, levels = c('C', 'B', 'A')); score1/ l9 I4 {9 a: o* v% ^; y: ^" y( M
" k9 k$ O$ H) {8 I/ r! j; o# O' E3、用cut()函数将一般的数据转换成因子或有序因子。
$ Z: y, u9 g d) e" X! {: [ 例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, : v9 ?! s5 S% N% D9 J
65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)
% B6 @7 v! g" }$ `/ kexam1 <- cut(exam, breaks = 3) #切分成3组
1 d; V! d9 C- W% D' r, cexam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组
4 J7 i6 Y$ u6 ~( A' gattr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class'), j4 p2 [ D* O* k. p
ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子
% W( w! K( ]5 C
1 T1 H! o1 H5 d
1 C& o8 n$ w( z" j- ^5 l |
zan
|