- 在线时间
- 514 小时
- 最后登录
- 2023-12-1
- 注册时间
- 2018-7-17
- 听众数
- 15
- 收听数
- 0
- 能力
- 0 分
- 体力
- 40040 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 12723
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1419
- 主题
- 1178
- 精华
- 0
- 分享
- 0
- 好友
- 15
TA的每日心情 | 开心 2023-7-31 10:17 |
---|
签到天数: 198 天 [LV.7]常住居民III
- 自我介绍
- 数学中国浅夏
 |
R语言录入数据保存格式转换矩阵![]()
8 \1 k2 J& S! }# s9 F( G) I7 H4 s5 a1 z3 c
index<-c("低收入户","中等偏下户","中等收入户","中等偏上户","高收入户")
V5 ?5 s4 J7 ~0 Z& nyear2008<-c(1500,2935,4203,5929,11290)
% u2 ]% z) v0 W9 h3 T% S1 q" Hyear2009<-c(1549,3110,4502,6468,12319)
/ u3 y- f# Z" {8 A# Eyear2010<-c(1870,3621,5222,7441,14050)
4 J+ M, N* d' ?. f5 I' C& _year2011<-c(2001,4256,6208,8894,16783)( G( d/ T, f) k8 M
year2012<-c(2316,4808,7041,10142,19009)
+ Z! U, O7 h& B3 ~$ d2 U/ Wtt<-data.frame("指标"=index,"2008年"=year2008,"2009年"=year2009,"2010年"=year2010,"2011年"=year2011,"2012年"=year2012)- Z4 U; G8 q% c! N
tt; y6 g( L* U- B% D/ J
0 r% a4 Z9 O6 @1 M* q0 qsave(tt,file="F:/统计学/实验作业/tt.RData")- h7 q% b) k5 `) s
load("F:/统计学/实验作业/tt.RData")' S9 u% _. F/ c2 {' G) X# C
matrix1_1<-as.matrix(tt[,2:6])* f3 O7 Q+ W; g6 o2 t& w
rownames(matrix1_1)=tt[,1]% w% L1 Y, Y8 \4 y
save(matrix1_1,file="F:/统计学/实验作业/matrix.RData")" {4 b- j! p8 U8 q( k
matrix1_1* `" M1 m8 _& t( n' n
基础知识:6 f4 k" c0 O h3 P! A9 E9 y
1.为对象赋值7 s$ n7 j2 D" [# |1 q( M Z0 _8 J
/ x5 J. [8 O9 d' p& H. {' \![]()
% z3 q; _3 H# l) N+ I2.对对象X进行各种计算和绘图
( T' C( L! q* u% X# i6 O! S8 t ) H+ y% k/ U0 S/ {( K
3.R包的安装和加载
2 P4 D! U; u& X, N8 C& U" ^1 ~查看
$ X8 n( }# R0 S3 k9 N( Q![]()
' B! m5 H7 p7 Y2 W5 n. B在线安装所需包7 @! r1 v+ s) z+ }
1 E' [8 h- \3 `9 C
一次安装多个包
, ^ m6 F$ p, |$ `# N9 h: N![]()
8 T0 t/ @7 L5 K' u }要使用包,需要用library()函数或者require()函数载入这个包
1 Z: C3 j5 y' g2 F4.在R中录入数据5 T T# ~& Q- p
(1)用C函数产生向量5 n: U# n, c3 K6 t! b* |' k
例:names<-c(“张三”,“李四”,“王五”)9 l. L' L) d: V: t5 ?9 L
. X, L2 Q! S2 l! ~" b
(2)将向量形式的数据组织转换成数据框模式
* N9 [+ J+ M1 n" b3 ^& h+ ^# N例:table<-data.frame(“姓名”=names,···)
8 i1 U+ d j `table2 P* c9 Y; f" n, S! Z
" b8 V0 R2 e* k' \% A, Q2 F$ {
(3)将向量形式的数据转组织成矩阵
. w) L/ B* \' s8 D/ A% W9 u![]()
, e5 L3 ]+ o; R; o* g(4)在R中录入数据并组织成矩阵
& r1 A7 D! X# F, k5 L" L. O![]()
1 ]8 C4 `" Q1 Y( r( V" v! |![]()
- _) y- z' y: t4 X& Q9 j5. 读取R数据6 ]; Y2 z3 w# d D# O
load(“load(“存储路径 /文件名字.RData”)”) ~$ a! p2 l4 I M X# W
读取包含标题的csv文件
# `/ B7 e% l" @ M9 Q9 H+ Zread.csv(“存储路径 /文件名字.csv”)
9 T. a& L2 v! ^6 O读取不包含标题的csv文件# p; b m3 U( [" w" X+ U
read.csv(“存储路径 /文件名字.csv”,header=FALSE)
; a8 U! C! D8 B( W. @导入Excel数据
/ g6 P% I3 W6 z* K7 \ 2 T. L2 f7 j" s2 l
]: S% i" s2 V! ?* p导入spss数据
) p# v' ?3 L$ V! Z) u. k ) A0 ~9 g/ S b
6.保存数据. b9 k! Q3 |; W- e9 l; Q
R格式. G# P7 }' _6 Y) V# N* y
save(table,file=“存储路径 /table.RData”)
- v# u& q$ u7 N; |csv格式
6 A6 r7 C4 B7 ywrite.csv(table,file=“存储路径 /table.csv”)& {. f7 i4 f; W; s y) N$ P- \( @
7.查看数据
8 X. N0 h7 B1 M% M6 f" N9 M全部 o! o1 _5 T& z7 q! o
table( ~9 G# K: y$ a) { r- V0 w! F
前几行8 V, S: }) r, I! ]/ H9 y) J
head(table)1 u9 p8 `9 h+ q& a2 m9 Y
最后几行1 u+ X8 Y+ _3 O
tail(table)# P% i9 g! F0 u5 R( b4 A# s; w2 }
8.数据排序4 |6 Q/ T' D& b: [' R( r, Y
升序:newt1<-t[order(t地 区 生 产 总 值 ) , ] 降 序 : n e w t 2 < − t [ o r d e r ( − t 地区生产总值),] 降序:newt2<-t[order(-t地区生产总值),]降序:newt2<−t[order(−t地区生产总值),]4 l5 b1 ^0 ^! w Y6 z6 P t
或者:newt2<-t[order(t$地区生产总值),decreasing=TRUE]9 h# C9 I- v" i3 Q
![]()
7 } g7 y& ]5 _2 n5 d$ D' H# U) g7 z5 ~; i8 K5 |+ h6 o
: ] D5 Q: W# U5 u: @6 E% x* D
变量重命名:
2 M5 X7 a% f+ _+ h9 ?3 J; r, Vlibrary(reshape)6 Q8 E# R0 R" T: {' A
rename(t,c(“地区生产总值”=“GDP”))( Y2 z" F! r* }3 K( Z# B# J
缺失值的处理:4 Z' \/ ~3 I/ W
检测:x<-c(2,4,6,NA)2 x, R2 R% G4 P4 ?7 c% x% I
is.na(x)
5 f8 |- C1 K& r7 G$ G4 M& y6 d+ H排除:x<-c(2,4,6,NA)
* C' A% D0 c6 O$ [+ u- }% ^sum(x)
/ y1 v# x1 D5 `/ w4 C1 Ey<-sum(x,na.rm=TRUE)
* Z9 Z! ] W& H. ^( e# G, ?/ q5 v& y" R* V& u4 X9 p/ t R8 j8 j
|
zan
|