QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6049|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    + X3 S. t& N7 r( m# ^目录
    ' S( O$ u& H: r8 v8 m; O一、数据介绍及预处理4 o, y9 e. |# L3 g! W
    二、新增确诊病例变化趋势
    ' R3 w  c. G0 M三、新增确诊病例全球地理分布" k+ v/ V  J/ [* \' l& @+ e3 b
    四、累计确诊病例动态变化图8 t7 X, N6 k! W  s4 _' z3 E+ I
    一、数据介绍及预处理4 ]$ A0 \; |& o5 X+ o3 p! l3 T
    1. 基本字段介绍
    : e3 j; z1 h$ u1 M8 g1 `- W2 p* U$ q7 F9 V
    字段名        含义
    / w! [# m3 q9 \6 W% r! qProvince/State        省/州
    8 Z& n$ Z/ V0 J6 z& d" S/ r+ vCountry/Region        国家/地区
    + I3 J. F/ o6 p' ELat        纬度
    & t$ C4 Y' @; H* w, y9 |Long        经度: D! ?, X& H1 h. K4 S3 x
    1/22/20-12/7/20        每日累计确诊病例
    ) Y" p) r0 l. l/ M( S
    3 F1 h6 J6 G6 C2 Z  K6 h4 t3 x6 O0 S( X: E5 O5 k! x1 B
    ! j" u, A- d7 t4 ?' F/ Z

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]: `, b; c$ B$ ?, ]* n( h0 {& b
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]5 n& |. L3 f( {
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]" g& w, x( t+ J- M% C
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]: b# B  A/ x: \5 I0 D7 K4 t6 ^
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      4 y$ L6 Y: r9 i) finspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]): X7 K" a( N( p1 ]5 J4 |
      increase_data<-inspect_data-inspect_lag_data# `. C2 H7 q- o, Y4 A! w( u

      . r& H$ x  U, O; |#合并数据,new_data为新增确诊人数数据" ?) Y9 V  N1 D  H0 |
      new_data<-cbind(information_data,increase_data)
      ) w6 K5 e" ?+ I9 {7 v! B4 b# I) g* ]# u" g% w+ n9 U4 c8 P
      1. 中国新增确诊病例变化趋势. Q. N" C+ |6 j8 ~3 G; c& x
      #合并所有省份新增确诊人数: k3 H& \9 o! H9 a& `# K& ^7 v
      china<-new_data[new_data$`Country/Region`=='China',]
      , o# e8 E& }% N' E( U- Qchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))- U6 `. u3 @. W. ?( I
      colnames(china_increase)<-'increase_patient'- u& Z; F: h! @8 V/ k0 a! n1 I
      china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d"); v9 ?2 d# p3 a. W. J2 z7 u
      % W8 b! }# X1 k3 Z$ E, X
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      % o  R. i2 R9 E  scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
      8 b! |( t9 Y# t  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      ( f; x- z1 r3 i8 U. B' K' I  theme_economist()+  #使用经济学人绘图样(式ggthemes包)* C; [! q% |* y6 g# I
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),$ ^# w0 z9 _/ A& i& s
              axis.title.x = element_blank(),: P# q, O$ |5 p$ m: `9 j
              axis.title.y = element_text(size=15),
      0 C! V7 p* B& P1 u' _8 G# ]        axis.text.x = element_text(angle = 90,size=15),* O1 O' p: q" @, Q! c
              axis.text.y = element_text(size=15),
      . C; `4 S) v! R$ Q* ?        legend.title=element_blank(),
        B1 P( M8 I; @" S( C/ H        legend.text=element_text(size=15))2 i8 N' G4 I- B8 z6 K1 m, i
      0 B$ T; R, z. }
                                   
      2 @1 x6 _* j) V) G! R8 b2. 美国新增病例变化趋势
      : J1 U  y4 Q7 |. tus<-new_data[new_data$`Country/Region`=='United States',]
      2 t, |# T* H$ P! e2 Ous_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')1 ?/ N1 ]) Q5 n* J1 E
      us_increase$date<-as.Date(us_increase$date)& M+ C$ u" h5 D
      ggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+8 `/ B% f* L/ N3 N$ H
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天7 m* U9 T. a& o  R* Z; r
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+. a5 W1 t& W! o7 {
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      3 D- R' h1 R( H$ W1 |4 {: }  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      8 {6 P/ [1 }9 S+ R        axis.title.x = element_blank(),
      % |! ?- A1 u, ?0 \        axis.title.y = element_text(size=15),6 W7 U& K; l6 y, x* @8 N5 M4 k, _
              axis.text.x = element_text(angle = 90,size=15),
      . ]+ w2 |0 t' D( l        axis.text.y = element_text(size=15),
      ; e* \: Y+ R6 K        legend.title=element_blank(),
      , N' }0 H* x+ r# x1 U        legend.text=element_text(size=15))9 V0 k. Q: a2 k+ g

      9 j. @9 E; p/ c$ f* d
      ! m6 `) M: M# t6 Z0 R2 g: d3. 全球新增病例变化趋势
      / Q7 Z% s9 Y, a$ J' a2 |; |total_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))& T  ~+ [3 W4 i- P7 q- U
      colnames(total_increase)<-'increase_patient'0 f1 E4 b$ P' a3 V0 b- e
      total_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")9 {3 I: b: {) ?! j
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      ! z- o7 ?* p6 x. @6 J5 C+ R! Z  scale_x_date(date_breaks = "14 days")+  C. Z  A5 ?0 W
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+' i" i+ K/ y( |) }- a" L) j1 P
        theme_economist()+$ H! @( A- {! `' R8 t, y% z1 I
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签$ Q7 \6 p0 y" I% r" i  S4 S* J2 d
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),
      & Q* [$ P9 C$ t* P                     labels=c("0","20万","40万","60万","80万"))+
        e6 A+ ?2 _) N( l  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      3 ^6 ]6 S( r) Y# N% X1 ]        axis.title.x = element_blank(),, u& H% C) S+ d5 j
              axis.title.y = element_text(size=15),
      + m/ q' v3 x  f) X        axis.text.x = element_text(angle = 90,size=15),3 ?/ A* X" `5 `0 C
              axis.text.y = element_text(size=15),
        b- |/ K! d  E        legend.title=element_blank(),
      / i5 j* J, `- Q        legend.text=element_text(size=15))
      / ~  B3 D: L! Q$ a# @0 [

      / h7 `, Q& l" C
      1 W/ c$ L3 M5 B4 Q& t三、新增确诊病例全球地理分布3 D; n" f  ~+ A. K: j3 o5 j" |/ L
      mapworld<-borders("world",colour = "gray50",fill="white")
      7 y6 w; f  F$ @) T7 y! e& h% oggplot()+mapworld+ylim(-60,90)+
      : j$ H5 ~% a' F4 T! R4 D' z& o8 V, F  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+4 }' K/ Y- c$ H5 `% l
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      # t: h: q0 o4 H' }  theme_grey(base_size = 15)+0 U% j5 a* }8 [6 A
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      $ v( M9 q3 C- V5 E        legend.title=element_blank())
      - Q) d% M8 L% ^' `$ b+ a- L; k9 f4 E' M6 V, ^) m
      ggplot()+mapworld+ylim(-60,90)+
      & a5 w0 r- w, v) [2 X; N: {  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")++ y1 G8 E4 l, R* w2 s. u
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+5 {" P/ U. D  O  Y' Q
        theme_grey(base_size = 15)+5 f; ~3 t1 l" U7 p) W( @
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),$ i- a  h) s% S5 x
              legend.title=element_blank())
      # i/ o* u; R5 F: y7 w) I0 W! }
      0 C$ {" W+ D( K/ I( |( G+ K  H2 d3 E; ?# e) ?* \- _
      四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

        K$ S" T7 e( W4 C( e8 V% X1 O7 L/ \

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      + I2 m$ [/ O  K$ r1 r
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      * ^+ g  Z' z! ]: x) n, vcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      7 [3 Y- y$ F8 }8 M7 w, vcolnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
        k8 l- y9 N  |7 @five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy")), l. e+ X0 a6 U' }! v2 r5 O3 A: v
      five_country$date<-as.Date(five_country$date)
      # M' z7 z  q" q. @! b8 F
      1 ?. g% {% m1 F% j) k4 @ggplot(five_country, 1 j/ x/ f4 h: I" c
                  aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      6 G' |4 C6 g  o) U  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  8 U* q# [1 T  Y) V' ~' S
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  
      + D" [) Y% @2 T+ I: a5 b  scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      # A8 L0 K: @- t  D9 }. N: f+ S  theme(legend.position="none",1 U9 ^# g/ p4 N1 Q  k' v
              panel.background=element_rect(fill='transparent'),9 N* e0 L8 Z2 a& |% W+ }( Y
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),4 Q2 c: [+ L/ \! G
              panel.grid =element_blank(),  #删除网格线
      2 \$ @  ]' _5 X0 P/ q6 h7 f        axis.text = element_blank(),  #删除刻度标签
      & v# @! y0 E1 a2 Q- J- v) f        axis.ticks = element_blank(),  #删除刻度线( `7 w1 ?  M; Q* O- A8 M9 j
        )+
        K! ?6 n  n. c' `9 q0 F" V4 V  coord_flip()+  
      , w0 e  P. t2 I3 R2 V1 b$ q3 ]; m  transition_manual(frames=date) +  #动态呈现
      ( d3 i: x# u$ o, C  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  + p! ~8 H* L8 h  {) f5 }/ r# d
        theme(axis.title.x = element_text(size=15))+( r; n& i- _4 v, A! U* k, i
        ease_aes('linear')  & g* B% _" K9 V

      ) D1 @. Z3 z$ d6 ]& E  P& k: [anim_save(filename = "五国累计确诊病例增长动态图.gif")
      + c  M: d$ S0 U
      3 F8 J: U8 v& o: N. a

      4 S1 Y1 n' e) i8 {) Q8 t( g
      8 ^, K9 y' w7 \5 O1 x
    % V: {- ~' ~" k+ U6 j

    " P9 |; o6 V/ r5 L8 K9 @
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 03:42 , Processed in 0.417185 second(s), 51 queries .

    回顶部