- 在线时间
- 27 小时
- 最后登录
- 2013-5-20
- 注册时间
- 2012-11-2
- 听众数
- 15
- 收听数
- 1
- 能力
- 0 分
- 体力
- 3870 点
- 威望
- 0 点
- 阅读权限
- 60
- 积分
- 1335
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 347
- 主题
- 320
- 精华
- 0
- 分享
- 0
- 好友
- 6
升级   33.5% TA的每日心情 | 奋斗 2013-6-15 16:58 |
---|
签到天数: 24 天 [LV.4]偶尔看看III
 群组: 第四届数学中国美赛实 |
因子(factor)和有序因子(ordered factor) 因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。
g N0 \/ z# _! A" D. J$ i! p因子表示分类变量,有序因子表示有序变量。" E# ?( ^+ o2 a) D$ P# l% o
生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的
( j. D& A. @- w1 v+ i- N [* G1 Z3 A( C+ j; Q
标签向量。5 D. f6 y( i* I) s# [2 _) [
1、创建一个因子。; L* j5 O8 y" o+ {7 W
例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')
7 F+ x1 ~4 D3 u* Bcol <- factor(colour)
4 z. l- l7 h/ Z. U1 f5 tcol1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容
1 U. y6 P# b! h" q/ Q8 {$ Y2 ycol2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3'))
y& e0 d8 U4 a6 \$ ]& ^9 fcol_vec <- as.vector(col2) #转换成字符向量/ q) l2 x5 s. t! p7 Y6 h
col_num <- as.numeric(col2) #转换成数字向量
: z N* U5 [! }5 }, Gcol3 <- factor(colour, levels = c('G', 'R'))
5 A! V" R l; o; O4 [& @" m% X6 X; ^, L5 I% q2 o D
2、创建一个有序因子。
, |& @, Q1 {6 } 例1:score <- c('A', 'B', 'A', 'C', 'B')
( \( ^, W& B9 S+ s$ N) N* bscore1 <- ordered(score, levels = c('C', 'B', 'A')); score1' G% T5 B1 M# [* }
: J, M: [) P8 n3、用cut()函数将一般的数据转换成因子或有序因子。
! {0 n* P7 D5 V 例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, 6 W) r- B& l% E) U5 O
65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)
1 C/ X; S9 S# f; E" I! {exam1 <- cut(exam, breaks = 3) #切分成3组
6 V$ o& j5 B5 x) M8 G$ I2 \exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组
& z, V: T$ y) i. sattr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class')) ?8 f2 u. b. |; m% p: J
ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子
/ T& _+ J4 i$ K' T3 M- r+ s4 r9 m' A
, a0 b( {, q6 G) m n& q# B |
zan
|