QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5657|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    2 Y! D: z% q7 t; v! ~目录
    ! D' B( P; o- Q7 f4 [一、数据介绍及预处理
    " L/ \9 }) H" N6 \& V0 _二、新增确诊病例变化趋势
    9 {: W% Z( [2 E9 M, S$ i# K三、新增确诊病例全球地理分布& {5 E. A% I) J0 Q4 W% S
    四、累计确诊病例动态变化图
    / _# T! o2 b* x: I$ l9 H) G& q一、数据介绍及预处理6 F  l3 u8 A* m/ v/ O+ e
    1. 基本字段介绍
    % {; r+ U! l: M* @
    / W5 A3 q8 d- L/ I' Q; I字段名        含义
    / u* t/ v9 t" @4 ^: sProvince/State        省/州/ S6 {' b& }( L( C- @0 D: q
    Country/Region        国家/地区
    " o4 s- {. M1 p/ ALat        纬度
    5 e( [7 Z1 _5 @  t1 P* JLong        经度. S4 r" `/ Z1 R6 G+ j
    1/22/20-12/7/20        每日累计确诊病例3 _4 p- B: |' D3 {" t

    / h: {4 L2 G& N  H* p
    4 z& d" \" O( w3 X9 R$ g
    7 q! t( t3 j1 `2 E, E$ }" W( x: ~  t

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]4 S; z/ S/ ]. a0 K3 d
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]
      ( U4 k8 U1 `+ L9 U
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      " u# d' w' K( C! a
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      5 T: b* |9 q) R( ~
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例+ l3 d" p( A( @2 h& |, Q+ f
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]). {: }  l" u. t4 i$ L8 V' y; C
      increase_data<-inspect_data-inspect_lag_data
      5 f% z5 _5 P; s* a- B' w
      , s. Y) `: `: ?: P! W0 a% |0 @#合并数据,new_data为新增确诊人数数据
      2 L- i7 Z! }* c; O6 s* @3 cnew_data<-cbind(information_data,increase_data)
      3 H$ z. O- a  F7 L! }* R( E/ |7 I# n! f" }! U5 H2 ~( D
      1. 中国新增确诊病例变化趋势
      & b% X& h0 D- ?  k, b7 r#合并所有省份新增确诊人数
      - t! Q2 h9 o. ]% S& t: o7 j- u. Qchina<-new_data[new_data$`Country/Region`=='China',]
      , U/ ~" Q2 p/ z- q0 a  b4 k) achina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))% k: M+ ]3 Z0 b! l. H2 J8 ~
      colnames(china_increase)<-'increase_patient'
      $ o) v2 y6 I. m/ e9 n/ B* L7 bchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      & ^' M2 F% w" [1 O4 y9 S, Q: `
      5 O4 Q( @$ g, m: H* Zggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      , K# t5 ^* X% ]3 V  F/ j. s& E7 q% q! V  scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
        D' A$ d$ X% E; H  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      * d) q3 Z' V1 l) m1 y% I( k8 a  theme_economist()+  #使用经济学人绘图样(式ggthemes包); d7 n! K1 z# r1 u4 R* j
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      7 m4 p3 Y* m5 s$ |, D3 F. }8 n        axis.title.x = element_blank(),
      2 {8 q( H/ Z6 B- T, h. d& J, u        axis.title.y = element_text(size=15),
      ) ~( I. N6 j- c# }2 p& O        axis.text.x = element_text(angle = 90,size=15),
      ! E, z  u' m9 o/ ], G/ D" A        axis.text.y = element_text(size=15),
      ( l- x: f' f1 S        legend.title=element_blank(),* Y4 y) D. U" v3 h5 r, J
              legend.text=element_text(size=15))
      5 O& E8 K& s, d3 a6 ^" |
      8 B0 c: ]! x9 m9 |. w
                                   
      ! z' ]/ X  ?# l. r2. 美国新增病例变化趋势
      3 a, G. D% V( Rus<-new_data[new_data$`Country/Region`=='United States',]9 d" Q8 O. h  z: X
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')4 j& T. F2 [( K' z: }
      us_increase$date<-as.Date(us_increase$date)
      + C; O! Q; i2 q7 B& Zggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+3 G) u  e+ @$ I3 d
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天6 a7 ^: K  ]4 k
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+7 \2 G9 S' A- U. A+ G( {! ]
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)! r, J% J! b/ k8 v7 ~/ |/ J
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),; h% l0 z  o5 ?8 F/ f
              axis.title.x = element_blank(),
      1 b5 g  y! H  M7 e& D        axis.title.y = element_text(size=15),5 u$ b1 h, ~9 r# u8 I; t6 O, z
              axis.text.x = element_text(angle = 90,size=15),& s, j/ @6 K8 [+ ~% z
              axis.text.y = element_text(size=15),/ ~7 M- d) A3 t' s
              legend.title=element_blank(),
        S1 V) d' w( {2 j0 x+ a+ j# N        legend.text=element_text(size=15)); N* d* g/ `1 @' I" w
      3 S( T2 g! b( S; b9 i) b
      4 \3 I" Z8 U" \" v: G  t# H
      3. 全球新增病例变化趋势
      + G( A, W; _2 X7 F. J/ y. w! o' mtotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))) L) S/ j+ _, C5 l! s
      colnames(total_increase)<-'increase_patient'
      3 |0 b7 N: T7 \; Ftotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")
      ! C" y9 _0 Y8 T& C/ j  s! gggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      ' y2 W/ ?: L0 \. e5 @  f( c3 h  scale_x_date(date_breaks = "14 days")+7 B, T9 r! [8 r& e8 T/ I, s
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+8 B8 V$ u2 ^( u% X, A4 S. ~$ @
        theme_economist()+; E' {- Y, C5 Q- h0 \- u0 R
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签- G0 A% R( R* ]5 F" \7 f/ _
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),
      1 T) R, l2 A6 L4 [+ I6 p                     labels=c("0","20万","40万","60万","80万"))+' y: i! b7 b4 H* B! V! F% u  ]- k
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      . {3 {: i! S/ t% O/ Y        axis.title.x = element_blank(),- y6 f- y4 ]) G5 C( V$ P% ]
              axis.title.y = element_text(size=15),7 p' e6 j4 q; f4 e# O
              axis.text.x = element_text(angle = 90,size=15),
      0 c8 ?0 `: M4 P4 R  I        axis.text.y = element_text(size=15),
      * W( E% b/ R1 k' Y: O4 _# V% D        legend.title=element_blank(),9 m6 {; }) P% \+ s; P' H
              legend.text=element_text(size=15))
      # o1 ?2 Q+ l$ `/ a9 z4 ~$ R# c

      ' u. H9 p* `3 m& ~7 o. ?' D
      ( D+ B4 x+ s. ?三、新增确诊病例全球地理分布2 S7 }. r8 P1 e
      mapworld<-borders("world",colour = "gray50",fill="white")
      5 `/ {6 T& @4 @" F8 _3 M; kggplot()+mapworld+ylim(-60,90)+
      1 ^" b/ Z) G* y7 x  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+
      ; ?9 p% `  `' m" p; L" o/ G4 t  scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      ( ~, w6 C, P7 y9 S  theme_grey(base_size = 15)+
      * d* b- n  y, W7 U  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      , H/ J- m, {( H" z; B1 B        legend.title=element_blank())  R, I- D6 |3 B6 |$ o1 I; b

      8 v: L1 s; i' i9 Y" R/ K5 @ggplot()+mapworld+ylim(-60,90)+4 z) [# U6 L% G
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      * k6 M6 S( F4 F& E8 y- \  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      + R/ f, n, \3 b6 B0 m  theme_grey(base_size = 15)+
      ; B% n* X  g: _1 a  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      & R5 E' M9 Y: E( O0 G% q# X' y        legend.title=element_blank())2 K) N; V2 X1 ~; H& j5 r" \
      ; ]1 B+ T( ^  I5 \9 n1 o0 l

      4 H4 Y' d5 ]( F+ O四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

      2 i1 \. u8 b# G1 w/ H% d

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      ! ]# q5 I0 ]1 ~9 o0 V2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图! b& r( ~. [+ C, ]
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      - E. z! m$ ~; D% S: r( j- L0 `9 j. fcolnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      . b7 J- b9 P  ]2 l- yfive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))4 P& g9 M3 e# i$ S; a" g8 y+ `0 W/ N: Y
      five_country$date<-as.Date(five_country$date)
      : |% X; Z1 {2 M. u6 [- Y: R! t8 x* F; Q8 x8 J/ ~) ^
      ggplot(five_country,
      1 b6 e  Z/ [1 ]- k  }2 ?            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      * p6 C2 H  L# |& R, J; j  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  " s8 J8 Q9 V& F; _$ ~  }
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  
      2 R6 e0 O" @9 i9 y  scale_fill_brewer(palette='Set3')+  #使用Set3色系模板# j9 ^. T  B2 J& U6 P6 U
        theme(legend.position="none",& L4 z; s3 G6 O$ f
              panel.background=element_rect(fill='transparent'),
      * i) F+ K/ U5 B2 H        axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),2 Y9 j$ k8 e: p9 \
              panel.grid =element_blank(),  #删除网格线
      # Z9 D, l; `) x6 |        axis.text = element_blank(),  #删除刻度标签
      , k( d# \- V. ^, ?        axis.ticks = element_blank(),  #删除刻度线
      ( u/ [* O6 x& Q; U# v! ?  )+9 z$ Q! p0 R9 s- }2 j
        coord_flip()+  $ j/ W% A2 ^0 j3 s1 J) l
        transition_manual(frames=date) +  #动态呈现( o* I7 I0 Y  V9 G
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
      8 C1 M; q6 f+ `* c2 s  theme(axis.title.x = element_text(size=15))+
      6 Y- a5 n! i" \4 i2 c0 ]  ease_aes('linear')  3 n, @' @" w0 }9 h7 b
      & ?( d  g4 @; [: f/ g5 e" y
      anim_save(filename = "五国累计确诊病例增长动态图.gif")7 O5 W8 q3 t5 N1 g! ~; b* |+ x

      " ]5 K1 ?2 E* g' S2 h  {
      ( b! b$ O- h$ S
      7 o, C/ c  H( F3 q0 D. x
    - H& d6 X1 w/ H; b$ U
    5 A8 J1 t- {8 ~* {( t
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-28 04:45 , Processed in 0.321555 second(s), 51 queries .

    回顶部