- 在线时间
- 27 小时
- 最后登录
- 2013-5-20
- 注册时间
- 2012-11-2
- 听众数
- 15
- 收听数
- 1
- 能力
- 0 分
- 体力
- 3870 点
- 威望
- 0 点
- 阅读权限
- 60
- 积分
- 1335
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 347
- 主题
- 320
- 精华
- 0
- 分享
- 0
- 好友
- 6
升级   33.5% TA的每日心情 | 奋斗 2013-6-15 16:58 |
|---|
签到天数: 24 天 [LV.4]偶尔看看III
 群组: 第四届数学中国美赛实 |
|
因子(factor)和有序因子(ordered factor) 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。% T7 C6 K# r% ~$ x* E
因子表示分类变量,有序因子表示有序变量。
# [0 P5 M2 c' _/ Q4 k: e生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的- [; d) {8 w# }' I' J
6 [: L- q0 c# J2 P6 n
标签向量。3 {$ W; C. |+ L6 u9 Z9 H
1、创建一个因子。; Q4 u I) l {6 j) z
例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')
* l# L: t* s# }$ C9 |9 \4 z' ]! lcol <- factor(colour)
) o8 y. D0 ~1 I) c& xcol1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容$ z4 I& u+ ^# a( v
col2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3'))! x8 b, ?' w0 o
col_vec <- as.vector(col2) #转换成字符向量; s& ]+ R/ `* j
col_num <- as.numeric(col2) #转换成数字向量# F: c$ s9 W/ E2 Q
col3 <- factor(colour, levels = c('G', 'R')) N3 b; Z5 E* `$ H4 G
8 X4 x6 I C- S% P
2、创建一个有序因子。
! ~! g2 o6 F0 S- @ 例1:score <- c('A', 'B', 'A', 'C', 'B'): Y6 |$ U/ X2 L& b
score1 <- ordered(score, levels = c('C', 'B', 'A')); score1- e, j8 X2 _5 i0 N" m& e/ _
1 P/ r0 t3 D( g. d V& Y; E
3、用cut()函数将一般的数据转换成因子或有序因子。' u) D$ H; _0 K/ u- [ ~* q* W
例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, * s1 }7 t# |2 v# d: t/ S
65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)
C( c0 x! R* K" r! B' xexam1 <- cut(exam, breaks = 3) #切分成3组# X5 }' o$ V9 U
exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组( t6 K# ~) O7 L4 d( j2 @% B
attr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class')
1 q* D/ j8 P$ l" H3 Sordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子
# L, G6 k9 c4 T
1 Y/ J5 G$ {( k- b
5 x( R: s& l" _& U; A |
zan
|