- 在线时间
- 514 小时
- 最后登录
- 2023-12-1
- 注册时间
- 2018-7-17
- 听众数
- 15
- 收听数
- 0
- 能力
- 0 分
- 体力
- 40029 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 12720
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1419
- 主题
- 1178
- 精华
- 0
- 分享
- 0
- 好友
- 15
TA的每日心情 | 开心 2023-7-31 10:17 |
---|
签到天数: 198 天 [LV.7]常住居民III
- 自我介绍
- 数学中国浅夏
 |
R语言录入数据保存格式转换矩阵 $ h4 x# X) b- }! y& l/ T; P/ h
3 k/ s \( h" n1 G* R
index<-c("低收入户","中等偏下户","中等收入户","中等偏上户","高收入户")6 Y, @' F% N7 O
year2008<-c(1500,2935,4203,5929,11290)
9 J) J- S$ m/ Z) hyear2009<-c(1549,3110,4502,6468,12319)0 H1 M; e+ c* y/ c
year2010<-c(1870,3621,5222,7441,14050)
# Q' G7 c# C& F4 t: _. @+ Fyear2011<-c(2001,4256,6208,8894,16783)% X6 o! O# u$ {2 S& W( I
year2012<-c(2316,4808,7041,10142,19009)
' O3 O2 S+ C4 Rtt<-data.frame("指标"=index,"2008年"=year2008,"2009年"=year2009,"2010年"=year2010,"2011年"=year2011,"2012年"=year2012)
& t! @, G. \; Q, w6 Att3 Y9 o8 b% D; P9 u
' T7 e( G+ }3 F. R7 ]
save(tt,file="F:/统计学/实验作业/tt.RData")" G- _) W* n9 ^; V- \
load("F:/统计学/实验作业/tt.RData"). Q" T+ b: k/ T4 e& Y
matrix1_1<-as.matrix(tt[,2:6])
- i$ d# {- C' N7 s2 @" zrownames(matrix1_1)=tt[,1]
3 x% x5 w9 a. v) Esave(matrix1_1,file="F:/统计学/实验作业/matrix.RData")
' k" F( z0 f0 _, Imatrix1_1
' `& c0 E3 `2 e基础知识:
$ [5 u( P; j- y G9 E8 X% K- F1 K( C1.为对象赋值4 c! I% l; ?. T) K# ^
5 }5 V$ d; ~, G ( w. d2 \/ L! T& ^3 o. c
2.对对象X进行各种计算和绘图, B8 u+ R/ ]6 H, j5 D6 N4 P- O
![]()
9 q7 G1 [; r) M6 T3 ~3.R包的安装和加载9 b) c* f6 \2 y% [- @7 m
查看
9 s( S- E! H4 R' U0 M4 d5 `' \![]()
- L o. w. D$ V6 N. K# u V在线安装所需包4 o7 e# u2 x) s2 t7 x
![]()
& }4 Q Y' l0 r2 d' H一次安装多个包
8 P3 _7 t4 {# }, m2 H' L![]()
7 L! q) d" ]) ?3 \. u要使用包,需要用library()函数或者require()函数载入这个包
1 `3 x+ z' S' M( M+ X5 Y4.在R中录入数据
' P2 Q* L% F3 n) a0 ?9 H3 I |(1)用C函数产生向量
2 O4 M4 Y; ]. r例:names<-c(“张三”,“李四”,“王五”)
1 u7 k% K$ e" H7 V0 T & T g: B9 S. B! T3 Q7 i) k( w
(2)将向量形式的数据组织转换成数据框模式
$ C, O, r+ C# S1 s例:table<-data.frame(“姓名”=names,···)7 [# p( j+ T3 }% [1 x: p1 x$ N
table- N N$ W5 |. D9 |
- w/ h% q6 Z: d1 V7 o: w
(3)将向量形式的数据转组织成矩阵, d2 ^9 s+ h) w m7 l
$ [6 @. ]5 M/ q6 X# D
(4)在R中录入数据并组织成矩阵. Q% J* \+ l; T/ R
' ^ e1 ` i H; `+ X0 V7 k
![]()
6 w* x( a. c1 i7 i9 C( x5. 读取R数据% Z2 e# _6 ^# A9 F: r6 g7 ~; m
load(“load(“存储路径 /文件名字.RData”)”)
5 l4 W1 p: `* x: D5 W% E. Y- B9 ^读取包含标题的csv文件
Y; s s/ l% ]9 }$ i) T( y' i6 {: uread.csv(“存储路径 /文件名字.csv”)/ w. |5 ^2 r$ f5 E: \5 _
读取不包含标题的csv文件
, G1 [/ H) L: O4 B% wread.csv(“存储路径 /文件名字.csv”,header=FALSE)
9 R- [1 E, x+ Q! h" }* s& b, k导入Excel数据5 V& V& i- u# s) _2 Y
![]()
9 B8 R% J0 i% D1 ^( Z; g f9 N( _8 d/ v6 r0 K
导入spss数据( l5 P& M0 I0 Q1 _$ O0 e. Z' Q
8 v: s* E: ^/ S
6.保存数据
/ V2 g6 K$ V' ?0 eR格式/ ?; e* i. k9 P
save(table,file=“存储路径 /table.RData”)
- M# C8 G$ f* A S# ucsv格式
) z* j, Z# Q# a$ d; iwrite.csv(table,file=“存储路径 /table.csv”)
* O4 t, E% D7 f0 |& ~" n5 y* _7.查看数据
+ ^$ [: ?' L2 T全部
: ?) n' B) M$ k# Stable
/ R& Y# H: ?+ |! F& B7 I$ ^前几行) H5 h6 \4 R% E: d
head(table)# a" _2 r: }8 H1 f f
最后几行, ~$ c6 k0 Y/ L2 [" U
tail(table)' ^6 ~/ I; n; w9 p; A! M
8.数据排序3 z) Z: U% T/ l6 t
升序:newt1<-t[order(t地 区 生 产 总 值 ) , ] 降 序 : n e w t 2 < − t [ o r d e r ( − t 地区生产总值),] 降序:newt2<-t[order(-t地区生产总值),]降序:newt2<−t[order(−t地区生产总值),]
) H4 b7 ?0 y4 X) p或者:newt2<-t[order(t$地区生产总值),decreasing=TRUE]
; F3 |5 H9 `, Z: c! q![]()
+ L$ F8 o) H" q/ ]* D
5 l3 i' N; O) j% k # Q+ j7 W3 }' N9 k$ j0 L6 F
变量重命名:5 ]( e7 J$ S2 D" P. H4 \2 k8 f: z
library(reshape)+ f6 i1 L8 l* P1 W6 o/ ]
rename(t,c(“地区生产总值”=“GDP”))5 j( O2 G( I$ l7 }# s; e6 G
缺失值的处理:
% N5 R' l) _/ ^检测:x<-c(2,4,6,NA)$ G) G+ h3 a/ T0 ^' z% O2 H7 b
is.na(x)- [; o) @+ O% _
排除:x<-c(2,4,6,NA)
4 }8 l, `6 E' J/ R* t4 j9 A |. u$ jsum(x)
! q! P3 J' l/ e0 iy<-sum(x,na.rm=TRUE)
' c0 m: u# `# [, g
/ h, z' t7 L2 M5 A- c& R# G |
zan
|