- 在线时间
- 27 小时
- 最后登录
- 2013-5-20
- 注册时间
- 2012-11-2
- 听众数
- 15
- 收听数
- 1
- 能力
- 0 分
- 体力
- 3870 点
- 威望
- 0 点
- 阅读权限
- 60
- 积分
- 1335
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 347
- 主题
- 320
- 精华
- 0
- 分享
- 0
- 好友
- 6
升级   33.5% TA的每日心情 | 奋斗 2013-6-15 16:58 |
---|
签到天数: 24 天 [LV.4]偶尔看看III
 群组: 第四届数学中国美赛实 |
因子(factor)和有序因子(ordered factor) 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。8 f6 [/ f& J) a
因子表示分类变量,有序因子表示有序变量。" r0 z- V7 W6 \0 g F
生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的
0 m2 s% w$ }3 `# b! j
3 l6 G3 F) _& v9 G, q/ K标签向量。& t1 t" o* x; w9 Y. L9 ?
1、创建一个因子。& X& i! b+ k5 Q; J
例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')' a0 U+ k! t) e Q; t
col <- factor(colour)
x- O5 M7 U5 {/ |! wcol1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容; Z- i6 N1 V% m) |' G
col2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3'))" d+ u8 Q8 o+ z) H1 A3 w
col_vec <- as.vector(col2) #转换成字符向量8 x/ w7 T1 O% o/ S& s
col_num <- as.numeric(col2) #转换成数字向量
o ~) S, y2 a' ~" Mcol3 <- factor(colour, levels = c('G', 'R'))$ R" m4 T. d' {% M
/ e* ^) I' e7 }5 y* I8 y$ h" `' |
2、创建一个有序因子。# ?( [, `. i& g. V3 T$ p
例1:score <- c('A', 'B', 'A', 'C', 'B')
. }5 Z1 {1 p% P1 w8 a4 mscore1 <- ordered(score, levels = c('C', 'B', 'A')); score1
# X1 J; s- w o) g% ^) E
; C- ^" E+ X( \) ^% x3、用cut()函数将一般的数据转换成因子或有序因子。
4 x" g U! _2 k( A) g( Y2 | 例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, ' Q5 ]5 D7 h! ?
65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)9 ]8 Y+ M! X) a3 H
exam1 <- cut(exam, breaks = 3) #切分成3组 G" `/ o/ v; I
exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组
% c# ~8 r, F! q ~attr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class')& K% s0 f4 ]& u6 n U' P
ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子' [+ r: K! D* S
# Y z2 I( r! ?4 d4 V: D7 F
# ]7 X4 | G7 ]) a9 G/ X |
zan
|