QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5634|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    7 W; U9 X. ^& y% x, Z目录8 m2 m" a" V, _& O: G( a# o
    一、数据介绍及预处理
    " S) u4 `1 l% {" K* V2 w( ?* j二、新增确诊病例变化趋势
    4 c1 f: x; {' F$ D  r三、新增确诊病例全球地理分布
    9 \% N+ V' R( H; _) U& B四、累计确诊病例动态变化图
    3 }* w* _. H' v! G& d/ x一、数据介绍及预处理/ b1 J" P6 |+ W* ?" R
    1. 基本字段介绍5 W9 `0 T* z) {
    " ?6 K* i% G+ n$ v. U6 D
    字段名        含义4 z& V6 G% S) Y/ w: [7 y+ o, L  l* L
    Province/State        省/州
    3 o( b8 z% u) V, @+ ECountry/Region        国家/地区# c! G: F' d, R/ A
    Lat        纬度
    ; d3 a6 c. b# |9 V/ LLong        经度% B+ |+ J# C0 w+ y  m, y1 `+ t. u
    1/22/20-12/7/20        每日累计确诊病例+ x5 S0 l, `! A8 o' @3 e/ \0 ?! l' X

    " {) N3 J0 ?, R$ ]& K, }: O6 x6 b( j# O2 E7 F

    * q9 ~5 m  @. \  z! y0 x4 @

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      2 q) r* D; r0 C& ?2 E% ^
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]6 ^8 ?8 |" i+ |: w
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]( C  ~, x) M2 Z. D$ g
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      7 [1 I' h' c1 e5 T4 a" Y
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例# G( W% r3 e4 H( {+ _
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]). j4 W. ]4 ?6 s3 m0 w
      increase_data<-inspect_data-inspect_lag_data
      8 M# \9 f. w: \$ K  a
      " A5 Z7 L# `/ \, X; ^#合并数据,new_data为新增确诊人数数据
      % H7 l6 p% w, j  Q- X, ]; Snew_data<-cbind(information_data,increase_data)
      5 G2 w6 J, e! e# {' @! j, ]- Z" L: J0 W6 u
      1. 中国新增确诊病例变化趋势
      # A! E3 K+ d. U8 f8 A  K3 }: e#合并所有省份新增确诊人数. c4 F2 L  L; r" Z
      china<-new_data[new_data$`Country/Region`=='China',]
      ( O" O# k' U& B, Nchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))
      * N# o) V  U0 |5 O( s. _9 Ccolnames(china_increase)<-'increase_patient'
      ' J* a" t1 L5 T9 ochina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")6 W: o" D# s6 Z0 x4 y$ M4 `

      6 ?0 p3 M0 s! G, v4 D7 N2 Qggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+8 S+ \+ k* I2 c. W5 l
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)5 q- [7 J# X' [* U
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+0 b( }5 T7 ^3 R" q0 H
        theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      4 v# i4 A! I1 o9 d, M7 @6 S. {0 g) i  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      - g8 q& m: h* k, S        axis.title.x = element_blank(),2 L) P3 s; j+ {+ X2 ]
              axis.title.y = element_text(size=15),: {: a6 f% r; p' T$ T& x
              axis.text.x = element_text(angle = 90,size=15),$ D. d' F4 [  ^; Q2 V, H  N5 U
              axis.text.y = element_text(size=15),$ W# p5 q2 P% ?7 I" R: `" @) S' W, C
              legend.title=element_blank(),) k4 u/ Q$ f2 J9 @5 A
              legend.text=element_text(size=15)): p2 P5 G  I& c% p, i: t& r) ~+ C3 g
      # x2 x& Z+ B* q) N& K  b" x! n% i
                                   
      : H! a, V& l6 k! J- D( s2. 美国新增病例变化趋势
      5 k1 t! Y# P5 t, f4 S5 G( \us<-new_data[new_data$`Country/Region`=='United States',]
      + z! X. ~" ?6 ^( D+ Ius_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      # V0 D# L0 g8 q0 K5 `us_increase$date<-as.Date(us_increase$date)* f% ~. {  N  ^  \7 v
      ggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      + u: D3 U' j* K8 j6 ~! x  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天
      5 a# I) T* I  }* E6 x' u5 ~  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+' D1 I7 h! p& K. _1 W
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      0 q2 U% ~( W- B  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),% H8 a8 z& _2 P2 K" D2 a
              axis.title.x = element_blank(),
      ) n4 g2 t. U$ f+ A0 j) [        axis.title.y = element_text(size=15),
      3 M% T% V8 y$ G3 V        axis.text.x = element_text(angle = 90,size=15),2 I( c) O; _( M5 k* _: ^
              axis.text.y = element_text(size=15),1 v; R1 {" y8 B+ Z9 j4 e
              legend.title=element_blank(),
      4 U/ V8 f# |. A5 ]        legend.text=element_text(size=15)). Z2 g: [  L* S
      - v( p- ]- b6 i3 R7 @  {
      ( W% U0 f# f# J" L" S! ]" H* a& \
      3. 全球新增病例变化趋势  I& w, F: L' ~# i
      total_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))) L6 l0 J. }' R
      colnames(total_increase)<-'increase_patient'
        E4 G0 E4 H# O5 ftotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")4 \7 E  a/ H; @  _9 g
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      + J/ `$ E6 v  }9 E  scale_x_date(date_breaks = "14 days")+7 G1 j3 r) d) _( W
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+& t& n6 b. n$ o+ _2 _3 x7 Q
        theme_economist()+3 r1 Y2 s2 s4 M* s8 d0 G/ s* q* |
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
        j. j- `0 C0 z' ]# f: {; x                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),
      / p. C* a+ J( ?1 h6 F                     labels=c("0","20万","40万","60万","80万"))+" s* f3 [3 S2 z5 \9 s
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      & r  I* [7 p$ Y4 Q" K        axis.title.x = element_blank(),5 O4 o& G# v% y3 ]) ]2 T' |
              axis.title.y = element_text(size=15),
      / m7 z$ u  q+ V  Y* c        axis.text.x = element_text(angle = 90,size=15),, U# B( ^5 J6 X' g! h( a
              axis.text.y = element_text(size=15),
      7 n: H5 b2 x/ E! ?        legend.title=element_blank(),( `( Y" L1 D7 w! B9 l. d
              legend.text=element_text(size=15))
      / k  ?/ s/ X0 q
      - }: q% w" _, q' @
      % B* [; \' {$ L5 q! f
      三、新增确诊病例全球地理分布
      9 I9 W# @5 O$ Y8 Y8 W4 emapworld<-borders("world",colour = "gray50",fill="white")
      / [0 B* v/ t3 Y; ?ggplot()+mapworld+ylim(-60,90)+
      ) o- g0 ]3 \( ?' X9 u  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+1 y: Z) N: d2 y( @
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+$ ?. T! P/ T; J
        theme_grey(base_size = 15)+* \8 O- ?, C8 R" N; |2 I( d  @
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      " Y, u* |% t! L- j! L! l        legend.title=element_blank())' G# W6 {/ C! w9 ]
      ( C9 Z. x! q1 r
      ggplot()+mapworld+ylim(-60,90)+
      ; _6 I6 ^8 c$ v  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+$ f* S) }, T& w6 `8 y
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+/ l! ^2 k( Z7 n1 P
        theme_grey(base_size = 15)+
      9 \; j( p! f. R; j8 v& R  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      ! P  B+ @* W  C# \' w        legend.title=element_blank()). h/ v4 M$ R: {0 i) H' ~
      ! i  H. M3 M1 M/ `
      . f! E# K5 n5 s
      四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      1 l/ b+ R1 w1 b. Y

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      ) F$ {: S: j9 q. K2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      1 c8 e' f+ f7 ?6 M) P7 Hcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      6 T: L. ^+ C8 f7 l5 ncolnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      ! ?3 i" V+ E2 a: o1 u/ F$ D5 afive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))* ]0 }# a# }) H2 d+ g% w, f* a
      five_country$date<-as.Date(five_country$date)
      4 d2 x+ ^) _, s* z4 l7 r
      3 }3 n. W2 q8 w! @8 vggplot(five_country, 4 O* O2 `  ?5 p# G
                  aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      # v! ^3 w% g; M, I! n: i8 o  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  & |1 b3 L7 e" m: N9 U6 d
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  4 I  S% J: U0 }( b1 D
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      8 L" c+ X$ o- K) C7 B7 n  theme(legend.position="none",
      - @' C" k, ]7 d; k7 r        panel.background=element_rect(fill='transparent')," L, u4 f" ]+ Y, u( O0 s4 X
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),( t# H2 f' v) p  C+ i6 }, w
              panel.grid =element_blank(),  #删除网格线- n8 n4 T& v, Z) F3 X
              axis.text = element_blank(),  #删除刻度标签
      % E( K9 _. o( ?; Z1 ~        axis.ticks = element_blank(),  #删除刻度线& w. ~& [, C* V- D
        )++ \1 E+ C# ]( x  D3 G6 ~
        coord_flip()+  ( x  _) r( }3 X
        transition_manual(frames=date) +  #动态呈现7 a" y) M1 ~4 h0 r+ I9 u; Z
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
        |4 ]2 Y" \0 B" F; E# F# N  theme(axis.title.x = element_text(size=15))+1 t& P4 p0 t9 O$ I* c. o
        ease_aes('linear')    I% z6 q  N  W& G3 r9 i3 Z2 T$ }% h

      * a# y' N9 D4 S/ ~2 zanim_save(filename = "五国累计确诊病例增长动态图.gif")4 |) ~8 o1 {5 Q# t

      / i) S. I+ ~! O! v
      7 m3 e% Y  u  x/ c* \2 Q+ G& W3 y" [) f% T
    * i9 o# L9 b: G/ M% s1 f: @

    / F) n6 {1 _( v# e+ I, n
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-20 03:46 , Processed in 0.453135 second(s), 51 queries .

    回顶部