- 在线时间
- 514 小时
- 最后登录
- 2023-12-1
- 注册时间
- 2018-7-17
- 听众数
- 15
- 收听数
- 0
- 能力
- 0 分
- 体力
- 40030 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 12720
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1419
- 主题
- 1178
- 精华
- 0
- 分享
- 0
- 好友
- 15
TA的每日心情 | 开心 2023-7-31 10:17 |
---|
签到天数: 198 天 [LV.7]常住居民III
- 自我介绍
- 数学中国浅夏
 |
R语言录入数据保存格式转换矩阵 5 J! }4 t- I$ k- n: U9 u( e* G; K
) H8 C1 ^4 p# z5 g) R( I9 x( \index<-c("低收入户","中等偏下户","中等收入户","中等偏上户","高收入户")
$ M& ]' Y- ^5 x' H/ W' ?/ vyear2008<-c(1500,2935,4203,5929,11290)
T. @. S, M9 w8 Eyear2009<-c(1549,3110,4502,6468,12319)8 G* N, R6 y1 ?, j& {
year2010<-c(1870,3621,5222,7441,14050)+ {/ u% Q- G! ^
year2011<-c(2001,4256,6208,8894,16783)
- | [$ f: S, b8 ?; U; F0 _4 Fyear2012<-c(2316,4808,7041,10142,19009)
" \" h- b+ w3 W+ [0 Rtt<-data.frame("指标"=index,"2008年"=year2008,"2009年"=year2009,"2010年"=year2010,"2011年"=year2011,"2012年"=year2012)
- e5 r Z& P& @( Ctt% [ D/ W( x4 u& n: m! |, Z
* {7 `. l. c zsave(tt,file="F:/统计学/实验作业/tt.RData")
" ~+ B7 U1 b9 C4 Zload("F:/统计学/实验作业/tt.RData")
6 E* N7 `8 p2 dmatrix1_1<-as.matrix(tt[,2:6])
% f2 F$ M" G1 r- G& M0 [rownames(matrix1_1)=tt[,1]2 S N+ U: _& z! S$ k* i8 c
save(matrix1_1,file="F:/统计学/实验作业/matrix.RData")2 v! q0 |$ c# J8 C! E7 @: H( L
matrix1_1
% o) Y. }9 E& }# C$ e) _基础知识:
4 c# c/ [& }" c1.为对象赋值# I( {# L8 h3 M" G
, z& y" D) U& {' B( N' p
![]()
! u& h* N! {: G1 \2 s- _( R2.对对象X进行各种计算和绘图3 P0 x$ w$ \3 h, L: R* d$ {& r4 q
![]()
4 y- j/ ?! q) f3.R包的安装和加载
& g% `9 N6 W2 b2 @查看% K3 [" ?5 U6 c! P! P, Q& F
![]()
5 d8 T& ~9 l3 r; I6 B* L; R% \在线安装所需包
! e2 e0 r! u5 S! w![]()
# ^" U' b A; t一次安装多个包! n; m% b; I8 f# r
, n4 V0 D' o4 N8 s3 F$ K' d
要使用包,需要用library()函数或者require()函数载入这个包
. r0 m' g2 T/ ?+ ]( M) o) M! Z4.在R中录入数据9 `" h; e' g; i
(1)用C函数产生向量8 t- E) m2 V. V9 d# S `4 i
例:names<-c(“张三”,“李四”,“王五”)2 }4 {+ B d; Z$ }, P) d
$ U7 z6 V2 m1 w8 e! s
(2)将向量形式的数据组织转换成数据框模式* S1 c4 G1 r" }
例:table<-data.frame(“姓名”=names,···)
* U! c4 o6 K0 s$ j4 @table
! E' c8 f0 O* y: ]6 z6 y![]()
1 s0 F! I/ ^% x9 {( ]7 _ q(3)将向量形式的数据转组织成矩阵& n; P5 ]6 \) i6 c: E
3 K# D; G9 U; X: K
(4)在R中录入数据并组织成矩阵
. ?, }( f# k9 Z![]()
, P S9 N# g1 I6 w+ P) E, f * c/ U8 j/ r* B
5. 读取R数据( X& j% e5 K) J% k C
load(“load(“存储路径 /文件名字.RData”)”)
; D& k; o3 r7 q! R读取包含标题的csv文件, u2 `: w4 U$ T& O' L& x( S3 V
read.csv(“存储路径 /文件名字.csv”)
; U4 H8 m# w `8 p读取不包含标题的csv文件$ T2 K! I- S! b3 E
read.csv(“存储路径 /文件名字.csv”,header=FALSE)% y3 i6 K7 F( Z: _; f
导入Excel数据/ D# q# V, a$ N" k
. {+ u7 S6 l4 |: G
. D/ ]. q' y4 q- P2 P9 `( D \导入spss数据
2 a n" i* @4 d/ m% R% T1 A2 K![]()
1 ^ w. o* C7 g2 f6.保存数据1 Q# C1 p+ M9 T' C1 ~4 H
R格式- h4 g/ Z1 e1 Y) ]+ z7 h
save(table,file=“存储路径 /table.RData”)
* s- n7 J' R& ~1 p1 bcsv格式
* B1 X3 ~/ v; I; Q/ t% ewrite.csv(table,file=“存储路径 /table.csv”)
( ?, T) F8 |, J7.查看数据
$ J) h, X5 A3 D* o2 A全部
& ~4 }3 r+ L/ z+ a Qtable
5 O5 h) _/ h/ C2 r8 a, ?- u前几行
- l8 _, P! I8 Uhead(table)* x- l! M: K3 _- m9 c( _" h) ?4 r* L
最后几行
& |& Q4 ~: @6 r' [; L5 T7 {; Ftail(table)
# E4 u# c* `2 l# }, v: d8.数据排序
4 P, F. f& n) r: h升序:newt1<-t[order(t地 区 生 产 总 值 ) , ] 降 序 : n e w t 2 < − t [ o r d e r ( − t 地区生产总值),] 降序:newt2<-t[order(-t地区生产总值),]降序:newt2<−t[order(−t地区生产总值),]
$ q3 V d3 L( E# q8 H8 q或者:newt2<-t[order(t$地区生产总值),decreasing=TRUE]
; }, x `& J P![]()
; N5 v: z0 ~& {; }1 D3 B3 U3 e1 [& b4 A& i0 Q
![]()
( `9 I& o9 ?/ r8 Z4 k变量重命名:
7 C. v& U8 A# I& O& e/ Nlibrary(reshape)
( Y1 z$ Y9 n- J. e; R5 xrename(t,c(“地区生产总值”=“GDP”))- K; e1 U! i/ i* @+ @# N. c/ ^/ W5 y
缺失值的处理:
: N9 p ~1 m, t# R检测:x<-c(2,4,6,NA)0 o' ^5 @1 F) `! O. ?5 a$ Q6 u
is.na(x)
* D4 [& u2 ~: K9 I- l6 s排除:x<-c(2,4,6,NA)9 U$ l7 V4 X1 y
sum(x)5 f1 i+ F! \ u1 Z8 }* x
y<-sum(x,na.rm=TRUE)
+ k) i1 ^2 ^+ r. S* ^; j' k9 K; W$ q; o: U' Y- g
|
zan
|