QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6079|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    ( ?) n0 G1 G$ t  r% h目录" A. h, v  `: c. K9 ~! ^
    一、数据介绍及预处理( i, \- ^3 e1 L7 i7 v$ g
    二、新增确诊病例变化趋势( X8 G: u" h8 x3 E
    三、新增确诊病例全球地理分布
    / b0 C$ {6 U/ P7 q( ?; w: y四、累计确诊病例动态变化图
    ) b2 t1 ^" g: d1 t& [  x一、数据介绍及预处理: \4 Q/ \7 }+ }! H7 h
    1. 基本字段介绍
    ) v) B$ i2 G0 U3 T) |$ E, p- W6 F. D) a; u; o
    字段名        含义9 H( C' B- T8 G! M0 M6 ~& E! o
    Province/State        省/州  P$ s; l) X# H/ Y( o/ T" d3 }3 y  K
    Country/Region        国家/地区, L, B- m& Q# U" D
    Lat        纬度
    ) y; I( b: N# \& LLong        经度
    8 }% g+ `) m: R1 P$ [/ ^8 k1/22/20-12/7/20        每日累计确诊病例% F; i+ h) _" g  \
    ) D3 n5 i8 t0 f1 X: ^+ Z* L
    ; s' U0 m" k( [7 i
    ' n2 V% X* c+ ^* \0 y

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      2 _- p. E. [4 _# e0 a
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]. b1 m: I' B8 d0 i! A
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      / K' ~4 `& t$ n- C0 R% O
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]8 [0 y' w+ R0 Q& E8 J# g) D
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例. e2 {0 a6 j, f0 d
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])# q' b3 E7 @4 ^# a9 a) S) _
      increase_data<-inspect_data-inspect_lag_data
      / k  M$ b; d/ R" c5 w4 ^: y; J
        z. q. F$ g+ ~1 T/ j7 L* J+ I/ y#合并数据,new_data为新增确诊人数数据
      : w& R; [7 O1 k) P1 T5 Inew_data<-cbind(information_data,increase_data)- ?# ?& X+ D# s1 w+ T2 R1 b

      ; N/ k9 ?9 W* |, x% }3 W# m1. 中国新增确诊病例变化趋势
      3 N, C1 f, ^' m& S: i#合并所有省份新增确诊人数# u4 E7 a3 z. [  A1 u3 c
      china<-new_data[new_data$`Country/Region`=='China',]" r& n1 Y- e' N; j. m( o
      china_increase<-data.frame(apply(china[,-c(1:4)],2,sum))3 l8 e( W2 N, M$ @- c0 Q0 G- G+ |: ^
      colnames(china_increase)<-'increase_patient': S6 f% I: Y# b7 A$ g4 h
      china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      % M- M+ }2 I; p% x$ ^# V/ t+ k6 E6 V' j) Z) }3 s. {
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      : Y+ f3 z) \, }: F4 v" ?( v( J. V  scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
      : E+ G- l) B, r/ O8 |) e5 b  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+/ u4 u  O1 H2 T% Y0 {% @% h
        theme_economist()+  #使用经济学人绘图样(式ggthemes包): \1 A: {+ X; q& l
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      4 J4 c5 I0 h4 U9 h3 I        axis.title.x = element_blank(),) }6 Z6 N& y1 p6 Q8 B/ t4 N
              axis.title.y = element_text(size=15),9 j$ l1 N9 V0 Z; w) D
              axis.text.x = element_text(angle = 90,size=15),
      ; v2 Z& \  x, S  k- U+ G" X        axis.text.y = element_text(size=15),
      0 |, b/ x& c- d  [        legend.title=element_blank(),
      9 r5 |. [. o8 G+ ~3 h        legend.text=element_text(size=15))" X- F. M8 Z" H

      / j+ l7 X4 L( q/ p* D) w3 M; M( ]                             0 ], w8 b: p. h" g* E
      2. 美国新增病例变化趋势
      " y, D0 Y* \" M' t$ d' jus<-new_data[new_data$`Country/Region`=='United States',]$ [2 m; @. N4 y) @: @( s9 ]# E9 Z, ?8 e0 Y
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      * i! G8 c1 i4 E! f/ _$ G& Kus_increase$date<-as.Date(us_increase$date)
      " L  S- F9 ^1 r7 n7 R' Pggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+9 l- q7 _$ U1 t3 b$ c# q! U+ H
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天; h# V  M/ M( ~& E" z' N
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      * n7 D& ]# D! t! r0 s  theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      : _" b- e7 {/ W5 ^8 A4 B  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      + h, a( i4 ~  H+ |        axis.title.x = element_blank(),
      & v# |" ]' T/ s) b8 O1 n% V' C        axis.title.y = element_text(size=15),
      . y  H% R  ^# \5 R9 e: k& b+ o; [        axis.text.x = element_text(angle = 90,size=15),& t9 o  y! r) z' O0 C
              axis.text.y = element_text(size=15),+ I! v* L* t- q& h8 w+ l
              legend.title=element_blank(),
      6 e; n* L! \# b! f2 d* P        legend.text=element_text(size=15)), s6 i, i9 Y' M  E9 w& S% n) Q3 R

      ( A7 q* \: O9 c( O; P, V
      3 K3 j3 k+ u& r0 h- G3. 全球新增病例变化趋势/ P% S: V3 _1 _6 M
      total_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))
      ! G  X( g5 \5 r% M  vcolnames(total_increase)<-'increase_patient'' m. O3 _0 g3 x  J: t5 l+ h
      total_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")
      ; v& e/ A/ }$ O6 O9 uggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+$ f$ h! X5 p; `" W8 T8 ^3 I; W
        scale_x_date(date_breaks = "14 days")+; c1 P, v! F2 h6 J
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+8 i$ s6 g3 j: w% `$ b) k: S
        theme_economist()+
      ! h5 d. |9 f1 [% }8 A* d  scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
      ! j$ X3 ~& e4 O! }; a                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),) l# a5 a' a1 g2 P
                           labels=c("0","20万","40万","60万","80万"))+
      6 H  c9 B4 g+ n( l8 B# k  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),7 C. R- W+ b, H" Q
              axis.title.x = element_blank(),
      3 N  I* B& H! m4 y7 I        axis.title.y = element_text(size=15),4 \# f! c- o! ^* `3 b* v% i
              axis.text.x = element_text(angle = 90,size=15),% i1 a, [! O, ]- C+ D
              axis.text.y = element_text(size=15),0 l! r9 l+ Y3 c: M4 f# m! G
              legend.title=element_blank(),
      8 ~6 Z6 O! w, M+ K2 S5 O        legend.text=element_text(size=15))$ X8 z1 m9 \+ U' f1 e

      / [; ~. M; \* z1 z* i3 [0 f- \; b1 i8 {  L! {
      三、新增确诊病例全球地理分布
      7 E- l) F$ n. q1 tmapworld<-borders("world",colour = "gray50",fill="white")
      8 M# c- G3 z* q) k2 U, m/ kggplot()+mapworld+ylim(-60,90)+$ s  ~9 [, G/ N3 `7 C% {
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+* w" D6 @0 |; q: ?
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      2 U& k/ i8 B- @" @1 Q  theme_grey(base_size = 15)+
      & x. }; s* B" R5 S  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      . Z8 k9 ^+ s) h! Y; f, J        legend.title=element_blank())
      3 l7 L; ]6 Q9 u$ m! u  N% e7 k7 Y) X* }. B
      ggplot()+mapworld+ylim(-60,90)+7 V, e7 _3 {* Z2 M" J, A3 d/ l
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      * Q4 I& ?8 A. M& J& R  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      : E: U" X; e" k1 {0 I* M( N" R( N  theme_grey(base_size = 15)+
      6 m) x# X0 L; q  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      5 e8 c5 R' s% u$ {) [( a: X5 J        legend.title=element_blank())
      ( N- a3 B$ |: m& [
      0 A# u! H, j; O. j2 ?1 P8 d
      4 X; J; |. ?% R6 g5 u四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      # n' U1 E: D/ e

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      ) f, }) V/ l" K8 k% n
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      7 p% V" g8 K. B+ V6 b5 I) B6 Jcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07'). z2 d  C) o$ l2 B6 t4 ^
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      ; H; G/ S* G  B+ xfive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      * `+ B7 V7 C& Afive_country$date<-as.Date(five_country$date)2 t, S, P9 K" y: a" }) {" t+ }8 N, X

      : H; c$ G( o8 @  u" k/ @0 X/ Mggplot(five_country,
      6 [, [1 X  p" v4 t2 i3 f            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      - i+ B; t& z+ W5 b& _7 a, t  s0 W  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      " a7 D% n9 }" x  f8 e  U5 w( R: m  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  0 _& ~8 D$ _8 E5 g" f$ E
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      $ D6 o5 W3 ^  V! j  theme(legend.position="none",
      7 ]0 c1 u/ g1 i4 k/ v8 w# f        panel.background=element_rect(fill='transparent'),
      4 c+ N9 X0 [: L- H% r; L        axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),! U! Q# C5 g7 S6 Q( `  d
              panel.grid =element_blank(),  #删除网格线! ?5 S: x) L& o; r
              axis.text = element_blank(),  #删除刻度标签
      8 y2 B/ ~" w3 B3 N  c( J) n$ c        axis.ticks = element_blank(),  #删除刻度线
      . Q- {: M: r2 N  )+
      6 ]. S# n) A7 J; Y7 Z. _6 v  coord_flip()+  
      1 C4 p5 [( g- j, h; c5 D  transition_manual(frames=date) +  #动态呈现
      - @2 N, c1 E# x( x  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  * G" c* X% Q) }$ d1 ]
        theme(axis.title.x = element_text(size=15))+- F- ~( y! H3 Q6 d" T% R# B
        ease_aes('linear')  * |& I3 I, K# G+ P. H' b

        a- c2 ~* Q. W0 oanim_save(filename = "五国累计确诊病例增长动态图.gif"), K" `3 q# ^- b& v. {3 D

      6 Z, J; \5 X: b+ }' S6 W2 i
      : ?2 _. `7 V& D2 g" p1 D1 j$ k" y  T' Z7 ]. [

    * B3 s7 B* x2 [" ?# }
    # l) X$ x! _% }4 O8 n: U
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-4 04:57 , Processed in 0.476055 second(s), 50 queries .

    回顶部