QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6052|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化  q* D3 t" G# c6 F& f6 V! L
    目录. `/ R4 j! K6 |; ~9 t! M. F
    一、数据介绍及预处理
    0 S* C' ^; |2 l  ^  N二、新增确诊病例变化趋势' f' T1 Q- G- d) E3 {* X
    三、新增确诊病例全球地理分布
    3 B5 A! A8 B6 ?- A% r四、累计确诊病例动态变化图" F9 D1 Q" @  L/ @
    一、数据介绍及预处理
    0 u! f: \; i) F" ~8 {: F2 D1. 基本字段介绍
    % f+ w, M; S5 C% y% m/ ?2 E2 f; l* ?5 Y2 E8 M
    字段名        含义
    7 ~, |6 P) F+ \5 hProvince/State        省/州* n" @, f' A- ~! W
    Country/Region        国家/地区' V4 S  w( k8 \& M. L
    Lat        纬度
    2 G5 {( r+ e+ ?' N0 z& hLong        经度  e% C* b% ~! X9 V2 p
    1/22/20-12/7/20        每日累计确诊病例# a  U' m3 g0 N" T$ Z* k% t+ q' W
    + M& E# {+ y. j

    ( P0 O- |: w9 R! ?# s! T1 e9 A* n6 t+ e6 c

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      * a5 w0 S  i' G0 O: d: N# v. e2 ^
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]9 }9 W! m7 S% V2 H# s
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      / R# V& Z( H9 ~6 k7 J$ J
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      & d& P! T( o( V- T  ^  t4 N5 b
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      . p: [; R* p( J3 u8 [5 @inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])
      0 V+ K: p* I( l  W  j( Kincrease_data<-inspect_data-inspect_lag_data! `7 w2 z3 [6 l# Q0 |- j! D, \
      3 \$ Q, G* I) o" Y
      #合并数据,new_data为新增确诊人数数据1 q) J( b8 n7 N( r! L: T
      new_data<-cbind(information_data,increase_data)5 ]3 `3 ?( F6 Z7 Z9 P( m
      $ H. y% _3 b1 r; n6 K* H" y. u3 ?) t
      1. 中国新增确诊病例变化趋势. \1 C! y& t3 v& ?
      #合并所有省份新增确诊人数/ G* j3 D- X9 G5 _5 C) x6 M
      china<-new_data[new_data$`Country/Region`=='China',]
      ! @3 q8 h* F; `4 t2 hchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))
      5 ?. t9 J& ]0 s# b; C" `) }$ P- ~colnames(china_increase)<-'increase_patient'
      , V9 r+ Q; J: m0 Rchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
        T' Y: b4 x% F  `% M5 [
      - b, {9 @& p+ \, n8 j3 r6 G$ X" mggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+) ^( F) N0 `8 `: ^7 a
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!); z! F2 K8 N7 b
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      % ]) f! j: ^+ B' Z  Y8 B  theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      ; c  M! `8 a, a) z6 |- K) V. ^2 B  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
        J  y+ m1 q% }        axis.title.x = element_blank(),' n4 A& _( d$ i
              axis.title.y = element_text(size=15),; @* x$ e5 I+ R. J9 U
              axis.text.x = element_text(angle = 90,size=15),
      % f( C7 o6 T$ i3 P, O4 D/ c        axis.text.y = element_text(size=15),# s  F; H$ V. ^2 A* h
              legend.title=element_blank(),
      6 O3 I$ h8 R" K4 b7 X        legend.text=element_text(size=15))
      % X& y6 C% j) x$ D3 w# U* M) z
      ( Z: L7 }  X6 f4 z# p! m
                                   
      0 x- Z4 h2 p& M1 L2. 美国新增病例变化趋势
        h" Q0 Y% b# W+ L& `# S4 Ous<-new_data[new_data$`Country/Region`=='United States',]5 i2 m) G& h3 |
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')7 G" g5 G9 U. Z& W( W, @1 V
      us_increase$date<-as.Date(us_increase$date)
      / Y- e  L2 W3 t0 ~ggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      4 \" t4 A. e. R$ y2 z' ?5 p  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天
      & a( p4 v$ l2 p+ V% c! c% M  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      8 s: ~- ]) B; p$ V8 H  theme_economist()+   #使用经济学人绘图样(式ggthemes包)& T; C0 j9 X( j8 N/ l
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      7 [3 N2 p4 o: u; @$ R, p        axis.title.x = element_blank(),
      . d8 g. a  s& Q7 f        axis.title.y = element_text(size=15),
      + k5 U1 z( ?( N/ k9 d        axis.text.x = element_text(angle = 90,size=15),
      : d8 `9 _. b8 V2 m7 q7 f" y        axis.text.y = element_text(size=15),4 c! U4 D- v: T
              legend.title=element_blank(),( w/ ?# ^( C4 K9 p
              legend.text=element_text(size=15))
      5 y! M" R% {6 K2 s9 }; j  N, w

      1 c: V7 K1 |/ A& W
      $ j! o$ m2 v5 H: o: i. X3. 全球新增病例变化趋势+ i" g8 W6 t0 {5 {! `  u8 P  @
      total_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))
      ) w  f8 @9 k) a! C) D3 h, Qcolnames(total_increase)<-'increase_patient'
      . O- P; s6 @. X1 J. Ltotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")
      & |! {' Z0 x( z6 Qggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+2 B1 s, V3 k& E3 U
        scale_x_date(date_breaks = "14 days")+0 n/ X$ p$ y) |9 }, u4 B3 [  S6 v
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+8 I% t7 \; u4 V9 B
        theme_economist()+  p; F& u4 W1 G4 w/ K4 R3 A
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签  g+ T, _- D- \9 h0 |
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),
      8 W: E1 y* a! _4 c+ V- S                     labels=c("0","20万","40万","60万","80万"))+2 c' _2 V+ E  q: a
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      ; \1 x) ?$ G1 N  k% `( i. `8 O        axis.title.x = element_blank(),
      0 s6 p& k7 T) a# ~/ w* E3 a$ R" U4 r        axis.title.y = element_text(size=15),
      * V3 u6 E- V! O1 X& t8 p6 Z6 F        axis.text.x = element_text(angle = 90,size=15),7 g1 K  g( D) Q( O& [$ o
              axis.text.y = element_text(size=15),; I" {% t: g7 A
              legend.title=element_blank(),0 u9 w% ]) Y& Z& X5 L: T( c
              legend.text=element_text(size=15))
      ; a& r0 R: b+ T& A

      2 I) m9 i4 p: x: a& J1 F& u$ {( [( {0 f
      三、新增确诊病例全球地理分布
      0 ~" ?, `$ [* Xmapworld<-borders("world",colour = "gray50",fill="white")
      ' N( \: L, B8 H: K* k& p% jggplot()+mapworld+ylim(-60,90)+  M4 |+ P9 x+ p! X7 i
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+
        ?. q6 a6 D: S' `  scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+. C9 v) B+ q) q9 |" j
        theme_grey(base_size = 15)+
      4 q( y! i1 m: B4 d  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),; {# g9 ~7 f3 z* \9 I" i! j( `
              legend.title=element_blank())
      ; B5 k: c* f& z0 X: ^7 T
      3 O; R8 o4 [- K; y7 b) xggplot()+mapworld+ylim(-60,90)+8 b3 N; _# Y, _3 Y% F" d  H
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+/ G. ?& C9 _# t- I( z. W
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+  O8 n) A/ b; s- ]3 z, }
        theme_grey(base_size = 15)+2 {; n' w  V; _/ A4 g' M9 ^- w' @5 n
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),# @7 A" d4 c: D# b6 y
              legend.title=element_blank())% X6 C5 X4 f7 n- E

      ! h. D. A$ @/ X  E# R* o5 c, O+ @# m4 c. }' o
      四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

      2 Q' d- J- d0 P' C+ {

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      3 ?4 Q! f) F8 r2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图/ s/ i9 D& m: W8 L
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      ! ~# t- v! G9 qcolnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      ) Q# e/ u1 H% P& ^2 Z3 `five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      . `" F) \/ F0 Kfive_country$date<-as.Date(five_country$date)
      ! L2 a  n9 C7 Z0 h: V2 {% z1 J0 M# ?6 Q$ w+ ~' e# E7 ?; x
      ggplot(five_country, 5 g4 a5 a+ |, w. k
                  aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  / e5 Z2 _( i7 o' T6 E+ k
        geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      ) i: p% o: H8 b- z. Z! J4 ~) J, P0 g  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  ; f8 u! s, q# l* ]
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板9 @) J2 D, A3 d" n' Z% K* d  R- o
        theme(legend.position="none",. s1 ]* s1 f* {8 J/ E
              panel.background=element_rect(fill='transparent'),5 X2 X/ U; S1 z8 l. r% P  ]8 ^# F
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      + L5 E6 g( N6 u, Q, d        panel.grid =element_blank(),  #删除网格线
      ' q# K; }2 R/ n8 ]4 d        axis.text = element_blank(),  #删除刻度标签1 x0 R% m: ?; }
              axis.ticks = element_blank(),  #删除刻度线' Q) p$ o6 a: a% E" u% j
        )+
      7 r0 o* D" B7 ?- a  coord_flip()+  ! [1 Z1 Y' E' N- n; V
        transition_manual(frames=date) +  #动态呈现- I! N* h6 u. F0 v. [1 `
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
      4 W6 l1 e/ r  d1 d4 X5 e5 K# W6 A. }  theme(axis.title.x = element_text(size=15))+
      % m; n* U% Z4 F2 L  ease_aes('linear')  
      . S" h/ q$ `% a) i3 _0 j4 @
      1 D* P  U- X4 X/ B& v5 C7 danim_save(filename = "五国累计确诊病例增长动态图.gif")3 \- K/ g- p! o5 P
      " Y/ D5 E( Q/ G# m) z# o$ p# x% T
      4 b' g7 M! {, q- t9 r7 s; c

      3 y( s) y( e$ g6 _

    0 p$ X  c+ p( n* ^+ ]' D) X. b9 x5 d- N( _1 ?- |
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 17:32 , Processed in 0.582403 second(s), 51 queries .

    回顶部