QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6047|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    & p5 k8 K6 ^$ i/ w. P) h目录- G6 ~; A! R* S" b; Y6 |- L
    一、数据介绍及预处理9 b$ G# w7 j) L+ f5 {. S
    二、新增确诊病例变化趋势
      i( J% A3 ~& ^+ |8 k3 z三、新增确诊病例全球地理分布# N' ~- v9 j3 ^- \5 O( _0 ?" r4 l
    四、累计确诊病例动态变化图
    8 N( m* U% @! z/ [8 l. z一、数据介绍及预处理7 E) x" T* [8 H: k/ ^+ q; Q) Z' |
    1. 基本字段介绍
    3 N, d% i- L7 {0 ?/ A& v' B
    ' Z% B7 j' J6 W- P, Y+ z2 z字段名        含义
    " s4 z# e  }6 C4 ~Province/State        省/州1 P7 s* F4 e2 V/ @5 K- Y# H( o; u
    Country/Region        国家/地区2 k9 ]8 D  O3 ~) h7 C9 V1 `* U. C
    Lat        纬度) [0 i7 u8 S" }4 ?% Q( R3 Q- z. V6 R
    Long        经度
    ( t# \5 }- P3 }9 H1 |1/22/20-12/7/20        每日累计确诊病例
    0 V. H6 @8 `, e& x5 |  a
    7 q# m! n* j3 `- x" \- S/ D( A- ]7 r; J* v" [. Y  B
    4 u9 o, t; V9 u1 T8 t

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      $ p$ ]3 |# V6 z6 e; C* c
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]
      , J# c* k: X2 ^! e% R
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      ; f: t4 z) k) w+ C( G0 Y
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]) m" w/ v7 {9 E- {( t9 u
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      ) V- F  j6 U" s' x4 hinspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]); h7 A0 ^4 h- \, I1 v
      increase_data<-inspect_data-inspect_lag_data5 I. o: j7 ?5 V: y9 y9 t

      ) H6 c/ r( @( \#合并数据,new_data为新增确诊人数数据, B2 z7 J' R) B
      new_data<-cbind(information_data,increase_data)
      % E  z# V1 T/ i* D: O2 Z1 b8 Z7 e: }) i2 M$ y) ~( ?0 ]' q
      1. 中国新增确诊病例变化趋势
      ' }' `0 ^0 ~. r6 P: k+ B#合并所有省份新增确诊人数* P. b% O% m& W0 d7 k4 n! Z
      china<-new_data[new_data$`Country/Region`=='China',]
      # }6 Z) w. u( k, ~1 |4 K8 {; e+ F* Lchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))( ^% v6 A& m. K% h5 _7 @, u
      colnames(china_increase)<-'increase_patient'# ?9 k$ U( {" C
      china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      4 j. N/ I7 B0 a2 x/ Z
      . ^8 [( b( s& ~* i& lggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      " h# |1 _$ C: R# ]( C' d  scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)8 b8 j0 F; d$ ~$ ~+ u! u6 u
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')++ P! y- [2 b( x; Q
        theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      - q4 V" }; c% w9 \5 L  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      . x0 B2 W' M' h2 k) C' [8 r$ S7 A        axis.title.x = element_blank(),4 y/ L1 g6 U- T
              axis.title.y = element_text(size=15),- N1 k* u, T% k/ Y- O' w  @. b
              axis.text.x = element_text(angle = 90,size=15),
      7 u5 @7 u6 [4 k0 E$ P7 a/ s        axis.text.y = element_text(size=15),
      ' d0 k' v. o6 h0 r! j        legend.title=element_blank(),
      6 O% H8 N" T1 y0 i        legend.text=element_text(size=15))/ N; l3 f: ?0 J: p3 F0 F& \
      , T: s8 a( O/ Y
                                   
      ! H: B9 r. K" N4 `: r2. 美国新增病例变化趋势, D0 N0 @1 J& ]
      us<-new_data[new_data$`Country/Region`=='United States',]/ ~! n# C  Z" D0 g+ q
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      * c! B2 x# p# o7 W: ius_increase$date<-as.Date(us_increase$date)
      & ]5 M! I. D7 M6 h7 aggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
        h8 R( H5 y. D7 D0 T  m2 `1 Z$ W% @- v  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天
      8 o. Y& {' J# K3 t. m$ v* y4 `  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      1 E( M: R. u$ u2 ?" g% C% X  theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      0 e  B% N4 o/ b0 u1 D, _. M  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      & F7 @  z, N5 C# |        axis.title.x = element_blank(),9 L" S; \; `/ X) r
              axis.title.y = element_text(size=15),9 |- J0 N3 V5 q* Y
              axis.text.x = element_text(angle = 90,size=15),# m2 |6 N: ^$ P; J0 {5 j- l! g
              axis.text.y = element_text(size=15),4 ]3 s; A5 U. \- d) K6 v. u& O
              legend.title=element_blank(),* T3 q9 o3 r! ^6 o0 U
              legend.text=element_text(size=15))
      , k( s: g! p: z
      # D( s! l6 e8 P8 A% h
      * m; F4 q. m, X2 K8 I
      3. 全球新增病例变化趋势
      8 i' [. D: a2 d  O# Ototal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))6 {! K* G6 P6 Q$ m
      colnames(total_increase)<-'increase_patient'  Y9 N, L9 t: {/ X
      total_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")5 a) w, L$ U% |  F+ m8 C
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
        K; @( Q" l; T' z' f  scale_x_date(date_breaks = "14 days")+. V( q- |5 c# d5 Z7 D$ s
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+, X3 D; w+ I0 u6 B+ i- a
        theme_economist()+) A& H7 _! L+ t8 [7 A
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
      : N0 `* N0 c1 o4 n                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),4 S) N2 V0 M4 D1 G" l
                           labels=c("0","20万","40万","60万","80万"))+. a  M, |/ ~# b' E5 s
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),4 C) t: Q- t) N* P) r
              axis.title.x = element_blank(),
      5 t0 m# A! `3 c$ F9 G$ {        axis.title.y = element_text(size=15),+ \- K1 ~3 V% G! u
              axis.text.x = element_text(angle = 90,size=15),7 o; m: b/ Y/ @" z2 N
              axis.text.y = element_text(size=15),- v# R8 B, v+ w: |  \& ?
              legend.title=element_blank(),
      0 y3 m& {+ m9 I% z2 e! d        legend.text=element_text(size=15))
      ( Q6 q) U) Y! `  e2 P& T

      ) S2 V# g, t  D) R7 u+ D; O$ q2 p$ t
      三、新增确诊病例全球地理分布% g! B& q/ J% I4 ^/ i. b
      mapworld<-borders("world",colour = "gray50",fill="white")
      5 X  A5 `0 l! I$ l0 lggplot()+mapworld+ylim(-60,90)+
      + w" d( s; i# c  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+
      8 M( ]3 _: s7 e: k% r  scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      + s" K- N3 p0 t- d  theme_grey(base_size = 15)+
      1 W2 Y$ L9 `8 w& D  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      2 q/ Q0 A; v0 H/ Q* g        legend.title=element_blank())
      * _4 U4 o% Y6 y7 p. e, L% ?2 W! u
      2 ?: X' R. J* ?9 }, A6 n/ `/ v" hggplot()+mapworld+ylim(-60,90)+
      0 m" O" d+ F4 K) o3 D  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+7 e# {; D3 A8 [: Y7 B
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      ) h0 G! Y4 w4 E& L$ q( c# Q  theme_grey(base_size = 15)+
      / e  E% x4 f" v4 v, V  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      ' q! h0 D( I/ X        legend.title=element_blank())+ y- M! I0 q  t7 Z
      9 D; V) e. b' o9 u4 X

      ; u' o6 g* Q# f. z( v" y1 X9 I四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      . m- ?  h- ^; F: ]) S. D

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      2 q2 C  z9 H+ }# x2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      3 u: \3 O6 ^1 B, D* l# tcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      ; n! C6 g$ @  Icolnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      . P5 J- {8 q* F+ mfive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy")), S5 @" h8 B4 e' T+ Y0 {# W! `# g  P
      five_country$date<-as.Date(five_country$date)
      * @5 r9 G: l( [5 V
      & T& y; t( G+ e1 O* Mggplot(five_country,
      8 R+ ~& k+ H+ j( ?4 ]! q3 s3 h            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  . A, U/ h' }4 M5 \' Z/ `! e
        geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      6 l. `# Y1 ]* [! B- U; X  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  4 I2 u8 q% t, t/ V
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      9 S- r- m$ a4 M2 n& `( E# Z7 \* G( W  theme(legend.position="none",8 H7 @' P6 R1 [; p0 y: v
              panel.background=element_rect(fill='transparent'),: g* ]: P: z8 N" a3 v
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      / a7 J' o" T0 z, J6 w0 O& ~        panel.grid =element_blank(),  #删除网格线& a& n8 P. o9 p6 t/ J% E, J
              axis.text = element_blank(),  #删除刻度标签
        E4 {& q/ J4 X- i8 E: f- e2 j' F        axis.ticks = element_blank(),  #删除刻度线  R$ ?4 R, t# Q& K
        )+
      5 ]5 l( N$ @! ^6 r  coord_flip()+  5 s. P* R& O0 h" U* w) L4 m* ]
        transition_manual(frames=date) +  #动态呈现
      ) o  z& n4 O+ P7 z  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  6 a. K3 y& z& w8 k. O9 {
        theme(axis.title.x = element_text(size=15))+
      ) ?  o0 O5 @. o  ease_aes('linear')  
      / b$ V+ k" p' U2 k$ {# N# A, g# Q$ Z7 y  e" I
      anim_save(filename = "五国累计确诊病例增长动态图.gif")$ r: r! m' l; S! }( o# L/ B

      ! l5 ]. P4 F2 J3 C; `: n( v) s2 _, ~& @( f
        Q# t) k% f, a( K+ r
    7 y$ ^+ s) z/ i- H+ y# L: C0 T
    1 x5 B! a; s: V: k/ J" C- k3 [
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 01:11 , Processed in 0.407633 second(s), 51 queries .

    回顶部