QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5659|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    ( i& C/ e2 U$ i% ^/ M# G+ u目录; k0 X0 z' ~4 v: l. l
    一、数据介绍及预处理( h5 H6 s: q3 e! N5 p
    二、新增确诊病例变化趋势
    " }& c& s# u1 ]% N! Q4 Z* a4 o, S三、新增确诊病例全球地理分布( k" t, U: j7 b
    四、累计确诊病例动态变化图
    + g( W6 k% i. ~' {一、数据介绍及预处理! w0 \' q2 x( Q* e, e
    1. 基本字段介绍
    7 n  F# a+ @' C1 o' @, A, @( [2 |9 @, Y- w0 ]/ v
    字段名        含义
    % e  H& i$ s& v% kProvince/State        省/州
    , ]: i' Z0 C2 \Country/Region        国家/地区
    & w) V* n$ b' l7 X1 b& Z( LLat        纬度# ?6 Q% Z4 n/ \) C
    Long        经度) E! G3 U% s. v6 Y% M3 `- @* O& e2 a. Z
    1/22/20-12/7/20        每日累计确诊病例
      q7 _9 F. C) D. G# {+ O1 m/ t7 M( e* C1 Z

    : x! H: y9 o3 u, ?) j$ @' f4 ]& z& H
    8 r( @$ w8 [1 Q# ^6 x3 p

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]/ T9 ]1 a; v( j: p. B7 E
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]
      " ?0 c6 G) {* ^: ^
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
        u- \  X1 H! s
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]" M& x6 y, t( B$ W* U
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例' ^; W  c0 E3 G
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]); Y* X3 H3 P  u' @/ _
      increase_data<-inspect_data-inspect_lag_data
        h0 V; s7 E# N) t
      9 Q: m/ T; n' L# K$ \# z7 a#合并数据,new_data为新增确诊人数数据
      1 n- P! E& f* o+ ?new_data<-cbind(information_data,increase_data)2 j4 [8 z! L' ]# O; R

      ' R- i5 J; _, \: T1. 中国新增确诊病例变化趋势% Q; K0 o3 [: `9 f$ ~* n
      #合并所有省份新增确诊人数2 X0 w( [% L  F/ I5 o  i
      china<-new_data[new_data$`Country/Region`=='China',]
      ' n* f, O5 [: tchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))0 W8 h/ x# G, Y8 r7 _& n8 N
      colnames(china_increase)<-'increase_patient'
      # \) ~0 G% i9 M* L! p- B5 t, S6 Lchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      9 B" {$ }1 x2 L9 W+ _) i8 S  m# D' R* A6 [
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+5 C8 W+ J/ u, [4 p+ g6 C, q
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)4 f& O: D  y, r; {9 ]! i
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+0 s, p3 [5 j/ J  _
        theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      9 b3 r: I' d/ u$ j  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),' L/ p) {3 k* W/ _/ E7 S. V
              axis.title.x = element_blank(),1 y9 B7 Y3 Z5 F# U5 w
              axis.title.y = element_text(size=15),
      / ^7 Q. e  t# d/ h9 \! g        axis.text.x = element_text(angle = 90,size=15),
      $ O9 Z, L8 ]3 p* ?        axis.text.y = element_text(size=15),
      # z3 ^# F$ ]' n        legend.title=element_blank(),
      ( j7 ^  ^" c& Q        legend.text=element_text(size=15))
      , T/ b$ u4 J$ F4 x. y

        l  K6 D: J) _                             + k  i4 D0 `2 ]9 M: H" ?8 u
      2. 美国新增病例变化趋势6 t4 |# ^+ A/ N6 A( G
      us<-new_data[new_data$`Country/Region`=='United States',]1 N! X; L6 S1 n- U$ Y
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07'); U4 \( k! \! M; G# i
      us_increase$date<-as.Date(us_increase$date)
      ! t5 u4 G+ j, \6 nggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      0 z1 t/ N  ^* i$ G3 r# I! d. V  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天
      / c) k: h& X) K$ s& m: O  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      9 @/ j* a0 b2 N( v$ ^  theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      5 R" s/ x+ d3 E. t; p  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      5 @4 M3 L* ~) C$ T7 h$ H6 a& i        axis.title.x = element_blank(),
      - l; b; R" \8 P: y, o. X        axis.title.y = element_text(size=15),$ z/ }$ j/ _+ u; ^
              axis.text.x = element_text(angle = 90,size=15),
      9 q% y% b. V8 j! u& P        axis.text.y = element_text(size=15),! N3 J7 K6 N9 E  p5 B0 B
              legend.title=element_blank(),
      ! h- A" k. |/ j( ]& U4 j7 ]        legend.text=element_text(size=15))
      2 `, U; v. r6 g- N; Y7 ^* U
      * W2 `& Y6 ~( Z$ I$ X3 N. S
      6 O) T2 m7 J4 V! t
      3. 全球新增病例变化趋势
      5 n3 x" V* a, E- \( E7 Ttotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))
      " {6 }% x$ F0 N6 |; @3 g: Icolnames(total_increase)<-'increase_patient'
      ) u7 b2 T+ v( k  Itotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")2 Y9 f# L" K( b/ d! M3 g' }$ w8 y
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      / Z' @: h; M! N  scale_x_date(date_breaks = "14 days")+
      . }: w" m' X% ^9 h, k' g: u7 R8 S  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+4 b" [$ N9 N' J
        theme_economist()+
      - M6 m' l7 p0 E# ~* m0 F! _6 H# k$ D  scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签( y* q9 q; S9 N1 R5 J4 j
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),
      $ o! b/ a1 |$ k$ q$ K                     labels=c("0","20万","40万","60万","80万"))+
      : G  h8 q0 l+ O+ F% x* _  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),# t' L  I$ H/ l$ r; u' v0 k: O
              axis.title.x = element_blank(),
      , h' |; x' A) C+ O8 v; I        axis.title.y = element_text(size=15),
      * N! j9 a" X* \" p        axis.text.x = element_text(angle = 90,size=15),  k" a" q* c  w  s+ F, C3 c
              axis.text.y = element_text(size=15),
      4 P5 t( X0 d0 ?% ~        legend.title=element_blank(),
      ) t$ P+ M. f4 s) p        legend.text=element_text(size=15))
      4 O( Y% P- c* V5 m6 l5 y  d5 B

      0 r8 t) ^; i/ J8 j$ M! _6 w8 Z2 t! z% k' @! \8 a
      三、新增确诊病例全球地理分布" W- e& n! F% Q0 X6 E
      mapworld<-borders("world",colour = "gray50",fill="white") ' F9 \: X1 S5 z& Q3 t/ I: Z
      ggplot()+mapworld+ylim(-60,90)+
      ( `# c7 w0 t' I+ C7 m8 ^1 d  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+
      . C9 s4 b2 w  ]  scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      / r7 A; y  y5 s  theme_grey(base_size = 15)+
      / w+ i8 ]# i0 g9 F) f% \  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),! g: U& P. ~, d
              legend.title=element_blank())( G8 W; ~4 s( j( Q& }% s: e4 i% t

      2 R: N4 A. n  vggplot()+mapworld+ylim(-60,90)+
      0 ~7 c# c* e) \  h- D  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      ) b. f& X  r1 ?8 ^7 [: U  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+9 E6 l  E2 Z9 g9 D) v/ t# T) d
        theme_grey(base_size = 15)+: u7 {4 `7 `+ [$ C: J" R/ H& H% d2 M
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5)," }$ v. ?7 o6 ~4 @8 H6 c9 M
              legend.title=element_blank())2 g. C$ n' [( P3 S

      1 B# s  p8 Z- V) k* d5 B% ?$ w, C. `/ [* F. k% G
      四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      * [8 b* J) [$ G( i: O4 b

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      ' ^! g; T$ p5 k; U% I
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图' `3 [# N7 _' A6 L1 s
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')3 q; ]! L( D. e3 j) x2 v- }
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      7 \4 v- [, D* W& |, n' mfive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))" K: z4 n+ g+ R; n# B. ?
      five_country$date<-as.Date(five_country$date)
      1 g/ C/ P' Z2 y2 V2 N/ [
      3 k2 [9 F. J1 f. x. vggplot(five_country,
      7 v* `5 V7 W4 q" I            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  1 _7 p0 [. ]: k
        geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      # T% |0 a* k$ V5 B; s! {, ]9 d; |  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  & [3 N' D8 B/ M$ [8 i
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板7 `5 J& B8 |2 `, w5 y1 Z
        theme(legend.position="none",) h7 E2 T) E7 B5 x  L
              panel.background=element_rect(fill='transparent'),& c) {, {7 F% T) L& \; ?* N
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      ' g6 z/ F5 u. y2 C        panel.grid =element_blank(),  #删除网格线: c% E1 _" W6 s! X
              axis.text = element_blank(),  #删除刻度标签2 }! j  T5 H. W- g" H+ T
              axis.ticks = element_blank(),  #删除刻度线; m& I( e* V0 I5 |
        )+
      1 B) z% g1 M+ n0 P( J* r. I  coord_flip()+  
      9 y- W% o4 i" |! [& F* G  transition_manual(frames=date) +  #动态呈现# [" @$ M; l- {- n% \7 H6 ?7 Y, T
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
      9 z6 J+ U7 c6 b$ q  theme(axis.title.x = element_text(size=15))+/ f) N! t  Q  |: {4 b* V
        ease_aes('linear')  
      9 q/ t, j7 J5 Y9 P: H* M
      + t0 k/ e  m0 r$ t0 x1 o' X+ O5 nanim_save(filename = "五国累计确诊病例增长动态图.gif")
      6 A; n. c0 q3 e6 o

      + V/ l, M/ \( x" e" _7 K' T
      " Y& n8 X# ~+ x$ A3 X7 g. o
      3 |( w  a, I2 X' i8 I8 n
    7 i2 x' n2 U) k* _

    - i$ ~) u4 ]) r. ~4 w
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-29 13:23 , Processed in 0.564144 second(s), 51 queries .

    回顶部