QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4310|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1158

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    9 D1 L* ]+ g7 Q目录
    7 ?% k" L, Q: d8 H! x一、数据介绍及预处理* V; I; ^# b& C( A
    二、新增确诊病例变化趋势& T  u/ l  C  D' D: x2 n
    三、新增确诊病例全球地理分布
    ! Z6 W$ I  R9 \. Y" }% C( `四、累计确诊病例动态变化图) a* ~& H0 {+ ?/ S+ j
    一、数据介绍及预处理
    % A% }/ h, w+ m( W& B3 q3 k6 g7 A) l9 S1. 基本字段介绍' P4 t4 ~# c+ q. h
    8 M6 S' X* C4 |
    字段名        含义
    , G! k8 {: |8 G" xProvince/State        省/州7 M6 n( M" a% U, O8 Y0 o. V
    Country/Region        国家/地区
    5 Q# X7 a! ~* y5 n/ @Lat        纬度; m! |: T9 ~! p4 U
    Long        经度
    + C( S- b5 G1 h1/22/20-12/7/20        每日累计确诊病例
    ( n3 C1 I( X% x. i6 T9 n% z2 }( Z4 s5 L- }' c1 J# B$ i1 j
    * H& b$ \1 i6 |' K
    9 E2 Q2 |( X7 o

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      7 z4 {9 U3 {8 ~* V2 ^/ P, V- j0 }
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]) _$ J2 v+ K4 d' k- _
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      - L& `3 A5 d5 C
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      $ h' R* P5 m/ b$ s
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例+ Q. t3 B* i: ]. u. J8 x6 q7 o
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])
      & b, l# U* l, _1 T( |) kincrease_data<-inspect_data-inspect_lag_data3 c5 w' v' o# z- j

      : T" U+ E5 f$ s8 [0 x: v: l! a/ R#合并数据,new_data为新增确诊人数数据
      * L7 U6 }1 p- i) Vnew_data<-cbind(information_data,increase_data)0 O  o: G( \' J' V  o

      ( e: y5 p" x1 g  W: t$ s6 O+ V1. 中国新增确诊病例变化趋势5 t& w& a! `6 f1 C" t  f$ D
      #合并所有省份新增确诊人数* {! \+ W% n. Y- S6 c8 t
      china<-new_data[new_data$`Country/Region`=='China',]
      ( F6 J) J; H* W# m& z6 C5 P9 Ochina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))' p/ ^  [& n* b! o. F8 y
      colnames(china_increase)<-'increase_patient'
      ( i2 G- n$ c# r7 S: vchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      - D' _0 _, N8 b% t! o1 j/ r3 p' h8 e! m
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+. E( S* m* Z' n7 y3 w; e
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
      % d! C( K  l1 W0 F9 t! o  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      # a1 I! D9 K( l% O# B  theme_economist()+  #使用经济学人绘图样(式ggthemes包); m1 w, K1 W+ R. y9 _' K. M/ h1 |3 H& ?
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      + q/ _+ p+ K' [7 P$ ~4 N        axis.title.x = element_blank(),1 A# L' W' ]; A
              axis.title.y = element_text(size=15),% J5 S. U1 m) A! ]5 b
              axis.text.x = element_text(angle = 90,size=15),1 h2 B) ^. P' \& z+ s6 L
              axis.text.y = element_text(size=15),
        P" d7 E- O+ ]" `& j4 z        legend.title=element_blank(),
      5 f) F7 x  K- B) Y- [  t4 m4 K% \        legend.text=element_text(size=15))
      2 t0 @6 q. D! B7 c( S

      3 m5 I( Y3 h, P, f8 w* b                             ( s8 X) ^  p- U
      2. 美国新增病例变化趋势7 {" [7 R( H/ g3 y* Y
      us<-new_data[new_data$`Country/Region`=='United States',]9 j; f% `: t, M8 t% [
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')6 A3 j3 y% |% w% J6 V
      us_increase$date<-as.Date(us_increase$date)
      7 M! W' ~* ?/ Z& ^ggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      9 S( i/ B! `2 }/ V! c  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天" D9 e- b4 a, T5 m7 b+ l  J" _
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      ) ^2 j: V1 P2 }2 b) t" x  theme_economist()+   #使用经济学人绘图样(式ggthemes包): j/ @! z) p" [- [7 @
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      2 Y4 n2 ]% g; l5 q- [+ v0 L        axis.title.x = element_blank(),
      + n; L* p3 I' p  m: Q! P        axis.title.y = element_text(size=15),
      2 V0 h6 C! s6 u; v  R5 i: W        axis.text.x = element_text(angle = 90,size=15),
      9 L. e: K- g' ]6 l/ R9 F        axis.text.y = element_text(size=15),3 W( _* `! a7 ^! c+ h
              legend.title=element_blank(),
      ; z0 H0 n  n1 O; ~, [# \% @+ a        legend.text=element_text(size=15))1 Z* h6 y; T) s

      * O5 \  @7 Y1 Q" K" n$ W% F+ t, t/ D$ n6 q$ W
      3. 全球新增病例变化趋势
      ; b2 x+ A8 n& ztotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))- S0 M# _$ E6 L) J, ?5 M" s
      colnames(total_increase)<-'increase_patient'
      1 f" \7 L. w1 u+ `4 ^% btotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")
      ! N* n5 F, g( \( q) h' O: Kggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+; l- b: T6 r1 ]
        scale_x_date(date_breaks = "14 days")+9 S: f2 e$ J: N' U
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+
      : N; l' B1 c/ x# J% M. h  theme_economist()+$ ^7 n0 Z& x6 O& o: U$ a6 G& ~
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
      6 X, F, ]" ]: B( _2 i' e# ~                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),+ V$ P) v" b- @" {. F  c1 v2 w0 s$ C3 I
                           labels=c("0","20万","40万","60万","80万"))+; I0 M' A! Z9 K) ^3 S
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      # _! U7 L: v' u! f+ _& h2 n5 S        axis.title.x = element_blank(),
      ( `. c0 L' F9 }+ G9 E: a        axis.title.y = element_text(size=15),3 l7 M: o2 i  K5 o" W  N) ]
              axis.text.x = element_text(angle = 90,size=15),0 e6 m' t2 d- Z4 @1 f
              axis.text.y = element_text(size=15),# ]8 i7 L8 I1 r- O: r
              legend.title=element_blank(),6 ^( i! q9 I5 ]) k' g
              legend.text=element_text(size=15))
      7 \/ N+ b8 |1 _
      - Y2 Q% ~7 C: B: t

      / z# F: c) o9 Z, Q4 Y$ y. p三、新增确诊病例全球地理分布% C% T- J$ O) X0 L
      mapworld<-borders("world",colour = "gray50",fill="white")
      - `% f5 x' t' U; m, m1 s  O! Kggplot()+mapworld+ylim(-60,90)+
      5 r! P9 S* R; l, O) u  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+  ?2 \& L9 c& }$ W
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      . B  S' Q% L6 d$ ^% W  theme_grey(base_size = 15)+, c7 ~- L" ?  C$ K5 R; M
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),: `# R- A. R- ^$ d3 |" N) ?
              legend.title=element_blank())
      6 @( d! @. Q* O* ~3 m# B: q# g4 I
      ggplot()+mapworld+ylim(-60,90)+4 R6 K1 L. u% o9 x9 D
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      8 A& C+ M( u7 k) m8 @, l' `  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+, I# y8 ^5 T# g' c9 u' A- `1 R
        theme_grey(base_size = 15)+- b  r8 q1 {$ y) M; S8 k! |- I, H
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      7 n2 @6 O) N( S8 n, l& K6 @: N( e        legend.title=element_blank())
      7 N/ [0 Y6 `: }0 H5 }, H3 d+ d* \% L; A) K1 S

      ' @5 N* O- _5 C四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

      * \3 X6 h( x- J& c, u

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      2 F! t/ D/ L1 M) e. E" B2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图$ v3 S* l' ]7 C! c' j; z
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')3 M# o9 K2 `3 z  g5 n2 ~. E
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      3 U( `) c) K4 _" _; Y4 e& |five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      , f) \5 s- o8 O$ l  x4 x* ufive_country$date<-as.Date(five_country$date)
      8 X6 v; i5 E: ?& |5 S
      ! g  d$ Y7 O/ @ggplot(five_country,
      3 |9 e9 [4 q, _% W  ?            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      + b6 f& y% z0 f; t& C6 ]  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  ! c% {: y' o7 p1 p4 C# ]$ F, W
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  ) t& v& O/ j4 O2 B' n
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      , t* f& }* z  d1 w" t  theme(legend.position="none",
      ; B. t7 o7 M( f; Z1 ]+ K/ c        panel.background=element_rect(fill='transparent')," a" J2 U. t& g0 y2 D" T8 q$ x
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      7 N- N8 R# y: J( s! L        panel.grid =element_blank(),  #删除网格线. e# L0 w3 `- p# S/ O! ]
              axis.text = element_blank(),  #删除刻度标签
      ( y( m9 x7 j/ t: e        axis.ticks = element_blank(),  #删除刻度线
      # O& H; B, h4 [; n6 [  )+
      1 T7 a% E9 v; P1 N: g* ]5 W' e  coord_flip()+  
      % l; U3 T$ ?7 B- _. A8 w8 K  transition_manual(frames=date) +  #动态呈现% F5 S0 Q$ Z7 c( U& n6 q5 }1 P
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
      7 @5 _: G& V* a4 s, [  L  theme(axis.title.x = element_text(size=15))+
      + t: T% a4 ~( x# I4 f  ease_aes('linear')  
      & h% v- @3 I# b- M3 Z) f8 \. E, _" T% S! p, |
      anim_save(filename = "五国累计确诊病例增长动态图.gif")$ V  c+ K+ t) W! [) U
      ; Y8 A& x* `( H# C( U) u2 M

      ( j5 D2 ?1 \7 b2 b
      ( v( k: t' E3 c- w, x! Q
    ; z8 s+ `" a& v' ?* p3 ?3 h
    3 B$ g3 m) X4 V6 T' m; h: E4 W8 k
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-24 05:58 , Processed in 0.246519 second(s), 50 queries .

    回顶部