在线时间 27 小时 最后登录 2013-5-20 注册时间 2012-11-2 听众数 15 收听数 1 能力 0 分 体力 3870 点 威望 0 点 阅读权限 60 积分 1335 相册 0 日志 0 记录 0 帖子 347 主题 320 精华 0 分享 0 好友 6
升级 33.5%
TA的每日心情 奋斗 2013-6-15 16:58
签到天数: 24 天
[LV.4]偶尔看看III
群组 : 第四届数学中国美赛实
因子(factor)和有序因子(ordered factor)
因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。 % O. d* z p: D) _2 E A: N
因子表示分类变量,有序因子表示有序变量。 0 w3 b% @7 p& Q% Y& L
生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的 b8 C2 Q( K6 q1 {8 k
* f- E' D r* V( |" p 标签向量。 + [) ^5 H9 L0 ~/ d0 ]$ W+ P3 M# o" a
1、创建一个因子。 1 H; V1 n% ?& j8 p( z; b4 X! W: ~
例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')
# F# e( h' n! i& Q/ c& g col <- factor(colour) " x: k; p9 v4 T' a: Y
col1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容
: m3 E/ V1 L ~. t, x col2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3')) $ N8 [! J1 {9 y, J5 F7 M
col_vec <- as.vector(col2) #转换成字符向量
( O% } j* a& ]* @. {: @ d. G# @ col_num <- as.numeric(col2) #转换成数字向量
& K# ^) c. w A0 y) C col3 <- factor(colour, levels = c('G', 'R'))
$ a# f [ V% r* N! C* E/ b8 E
' H1 i& y4 O$ O5 b6 \: k 2、创建一个有序因子。 3 r) c% e! ?5 [
例1:score <- c('A', 'B', 'A', 'C', 'B')
5 F$ {9 s. v6 j- M { score1 <- ordered(score, levels = c('C', 'B', 'A')); score1 : ^9 `3 W: y6 s \5 R. ]6 v
' x/ o, A7 g4 Q$ M
3、用cut()函数将一般的数据转换成因子或有序因子。 4 F H! ?; w t! q) x" a1 `
例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98,
% F; U0 M8 f; f- `" b* a 65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88) + J3 y8 F9 C5 O" `. ~" _- A
exam1 <- cut(exam, breaks = 3) #切分成3组 ( h0 s# ~7 p# b
exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组 4 C% V& p7 ~1 P' `# w4 e
attr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class') ( z8 h8 I( T l" Z0 O
ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子 7 d% ~, d3 Q7 _& L
/ C( c. p: a0 y3 @- p 7 p0 z* l( y3 c t- ]" z' g4 Z
zan