数学建模社区-数学中国

标题: R语言入门基础之因子和有序因子 [打印本页]

作者: 数模天下    时间: 2012-12-24 14:02
标题: R语言入门基础之因子和有序因子

因子(factor)和有序因子(ordered factor)

因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。, I8 e3 o& p2 i, O
因子表示分类变量,有序因子表示有序变量。
4 d3 c, ~1 m$ f0 X/ A' I生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,labels是因子的! a. i, k: ~$ ^& q. ]1 b0 S
$ I! l: h# a0 s' _. G6 R$ z
标签向量。: |6 Z/ ?7 \2 D
1、创建一个因子。2 O' z0 U% Y) b; B- J- ?
   例1:colour <- c('G', 'G', 'R', 'Y', 'G', 'Y', 'Y', 'R', 'Y')
( H  a( F9 j* d7 M' [- Xcol <- factor(colour)
( C8 T- j2 W" d4 \  T; F! icol1 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('Green', 'Red', 'Yellow')) #labels的内容替换colour相应位置对应levels的内容
% f( }# b+ W. X1 P6 ~& acol2 <- factor(colour, levels = c('G', 'R', 'Y'), labels = c('1', '2', '3'))( y" g, \7 b, [3 w' K3 e9 \* j2 J
col_vec <- as.vector(col2) #转换成字符向量
8 C( B3 \8 i% w# z: {0 w- C3 Xcol_num <- as.numeric(col2) #转换成数字向量
/ E- |8 ?9 j/ Mcol3 <- factor(colour, levels = c('G', 'R')). |& y5 L4 H9 T7 o( z1 z$ {
6 E# [3 L% k4 `4 c1 J% T+ ]& u
2、创建一个有序因子。- y" ^" d$ b3 I1 q3 k- P9 D# f
    例1:score <- c('A', 'B', 'A', 'C', 'B')
( a: g* m0 ~* s& ascore1 <- ordered(score, levels = c('C', 'B', 'A')); score1( |, K  p' B# U- o
/ W/ W1 V% j  R) M7 k6 u- }4 t
3、用cut()函数将一般的数据转换成因子或有序因子。
: N  W" M( D2 t: [) N( Z. F    例1:exam <- c(98, 97, 52, 88, 85, 75, 97, 92, 77, 74, 70, 63, 97, 71, 98, 9 i7 _3 g9 q/ Q
  65, 79, 74, 58, 59, 60, 63, 87, 82, 95, 75, 79, 96, 50, 88)
) t" X4 R4 d: b7 `exam1 <- cut(exam, breaks = 3) #切分成3组# o% N$ `" m) v. [3 F- `. v! B$ ~; i
exam2 <- cut(exam, breaks = c(0, 59, 69, 79, 89, 100)) #切分成自己设置的组7 s# `5 p" ~( w) e% V( U6 m- Y
attr(exam1, 'levels'); attr(exam2, 'levels'); attr(exam2, 'class')
! M9 F/ C* K! t# |ordered(exam2, labels = c('bad', 'ok', 'average', 'good', 'excellent')) #一个有序因子
- }* K% D% |3 j9 O8 Y
. n: G0 p4 x! Y+ z
+ p( k) z4 a& Q




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5