QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5667|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    1 k; @& i+ P2 L6 W4 }  {# y目录6 ]: w0 P% J8 l' P  W' M3 N
    一、数据介绍及预处理
    $ Q, [0 l, g- G% [5 d- x# R二、新增确诊病例变化趋势) X  Q, K: _) H# i& A; a! e
    三、新增确诊病例全球地理分布2 z/ k5 o  ^5 P/ k: x! [4 E( x
    四、累计确诊病例动态变化图6 q0 B! F6 O+ z5 {+ c* A# N" x% R
    一、数据介绍及预处理
    0 h! g7 z+ p( |' i4 x1 X: b; z1. 基本字段介绍
    : d2 H1 ?! X2 F4 P
    * G. v/ m3 ^/ O0 s; l- k字段名        含义$ I+ S2 O4 g( z& e: H# X2 Q
    Province/State        省/州
    + @8 R1 D: p& P; l- B' Q1 ECountry/Region        国家/地区% X/ {) J3 X2 ]; g) d
    Lat        纬度1 H$ w2 k- S9 h0 k+ N: d
    Long        经度
    6 f$ K4 K' \2 l& i, Z# S  O0 t9 L1/22/20-12/7/20        每日累计确诊病例
      v3 @1 N. i! I
    + _) J( a7 b, E- T3 f
    # j* N- a# D% ^! P
    9 A' q- M, K" m2 P1 L

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      5 W" x- h$ |1 x1 @% \& ?5 t
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]
      + [( M+ s2 A% R
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      % _9 m1 x9 O, {4 K( V9 f' \
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      0 K, h, e6 [$ y- g7 Y5 j9 i/ U# p
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例; z  j$ S7 r% U( I, l
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])+ Y( ~: \2 U/ E4 Y5 u/ C# Z
      increase_data<-inspect_data-inspect_lag_data6 f2 ^& a9 `5 F2 _3 o  k

      1 p- j* t# ]' |6 X7 o; y#合并数据,new_data为新增确诊人数数据* u3 R- t9 L: e1 @# G7 T
      new_data<-cbind(information_data,increase_data)! M; Q3 J7 _0 J3 O1 M6 G
      9 ?* P5 d) ]0 Y0 m, a: h
      1. 中国新增确诊病例变化趋势* F* B; r# p( v. m
      #合并所有省份新增确诊人数" z" A5 t+ w5 B2 P
      china<-new_data[new_data$`Country/Region`=='China',]
      5 k! m- T9 i+ k! U* kchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))5 D; W- Z: x3 u1 p3 S. A9 Y% n) U  k- g
      colnames(china_increase)<-'increase_patient'
      : \  _4 _- n& fchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      $ _* t1 W; w! k/ P- q- S( e/ d+ ~/ a; z9 n7 w; l: C0 t: |# T8 ~
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      6 S- {3 ]+ x$ S8 v  scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)( D* l' e+ l! \- {
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      ) ]9 v! R. F! r. j/ Q' a7 H  theme_economist()+  #使用经济学人绘图样(式ggthemes包)# E. }1 D0 Q5 G2 _
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      / X: y) s+ }% _2 h5 n, M' p) D7 {        axis.title.x = element_blank(),
      + o: j0 @0 Y8 f4 A3 `        axis.title.y = element_text(size=15),% b  `1 a$ I) M( i4 g- }! `% a
              axis.text.x = element_text(angle = 90,size=15),) k& N, H( |5 i6 U
              axis.text.y = element_text(size=15),
      " j. t- u* I4 ?3 {2 A) b        legend.title=element_blank(),
      6 b3 U& T% j2 J3 t0 e, ]( H2 Z  V% E        legend.text=element_text(size=15)), j! k9 \, N. v1 l- t0 F1 N& W7 c
      9 g9 [0 _" ]: c# @  L9 U
                                   
      7 v6 U0 S2 l1 i+ ?9 f0 `2. 美国新增病例变化趋势0 G& V1 i1 K: A' H' \5 b; `
      us<-new_data[new_data$`Country/Region`=='United States',]' ]$ ~$ O0 r6 m  M# @( o
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      & V1 n8 R* i3 xus_increase$date<-as.Date(us_increase$date)
      7 Z9 l2 c% h& Tggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+  q$ ~$ x; i6 n/ s. v
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天& I' Q/ Z* F* X8 z  n! d
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      $ |, |* v6 I3 Z+ j) |5 D7 x7 `  theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      ; y4 P) I/ |6 b/ a& A  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      + U0 E& j' i% q        axis.title.x = element_blank(),, p+ L* |4 k/ c3 @3 H4 k
              axis.title.y = element_text(size=15),! ^' Q; x& H8 k3 w/ ?
              axis.text.x = element_text(angle = 90,size=15),
      $ |" }: \- B* ]0 U8 {: S* e        axis.text.y = element_text(size=15),
      $ E3 P: _* X# o" [        legend.title=element_blank(),/ L, y6 |) C; z+ A# F
              legend.text=element_text(size=15))
        O  O, j) D; q( B/ K4 L1 u! ]8 d* ]

      $ N* l1 _% y4 R* S: N
      8 r  N/ A* i+ {. A, m3. 全球新增病例变化趋势
      ' q' _- M( g3 X. z- v& vtotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))
      " z; |& m# _$ A/ i+ ^* [% ~colnames(total_increase)<-'increase_patient'
      ) y$ P. ^$ \/ Y% g% [8 h% Itotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")( J! N& d; f& u( Q; N$ O! x
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+  s& e' E6 p, Q2 b$ h
        scale_x_date(date_breaks = "14 days")+
      : L1 w: G' C! p  g& k  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+: Z( T1 h2 O1 I9 `+ j7 g
        theme_economist()+
      / N5 s7 ~6 t( ]4 \7 i% \  scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签% w' _: k( R! z* D
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),) p" t# R  e% j* h' T, ?
                           labels=c("0","20万","40万","60万","80万"))+
      ' ^) K) R; I4 j$ L0 ]8 w  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),; w8 O7 p" j7 @! R4 b
              axis.title.x = element_blank(),
      " x* t8 H% C( m- A' c+ [        axis.title.y = element_text(size=15),
      ! }$ _/ j; m  A+ a. r' G- |; [        axis.text.x = element_text(angle = 90,size=15),. C8 ~. B8 m6 {  ~# q6 [9 [
              axis.text.y = element_text(size=15),* b6 @* U6 H' j- h
              legend.title=element_blank(),
      ; J$ F& ^; n0 P! ?' h        legend.text=element_text(size=15))# T& d5 A0 H6 @1 X) G4 Q
      . }5 z7 |1 ?( m7 Q( @2 b% ^
      # N; J2 N- z7 W, u9 S
      三、新增确诊病例全球地理分布, K) U$ i% R! }% v: J  h0 {4 K( u
      mapworld<-borders("world",colour = "gray50",fill="white")
      # i, ~' }3 C8 |8 @( I7 T5 Oggplot()+mapworld+ylim(-60,90)+* Z) K0 B3 A7 P+ Y: t" k
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+! E: @; r, }* H" w4 z
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      9 n* w( M4 i( e* a0 c. i  theme_grey(base_size = 15)+" W( ~, D" [5 A0 y
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      . ?# K6 i- J( l/ z; A9 G* y; v        legend.title=element_blank())
      ( ?* O& Q1 L" J" b- `( x2 ~9 o* v3 k- ~" j. K
      ggplot()+mapworld+ylim(-60,90)+
      + J2 D8 i6 D, L: y) V2 O  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      ' ]- d" F( F2 Z/ y5 z1 t- i$ c% i; N  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      4 m. J1 z/ w" u) l8 |" u9 l  theme_grey(base_size = 15)++ s5 a7 K' O  I/ ^, c
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),: K3 u# n  d* V
              legend.title=element_blank())
      & {+ L, \8 g* |0 b4 I. e
      , ]2 t# N; F1 R, m
      / E/ c9 T: D0 X) n4 d; W) W1 ?, ~四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

      : k$ Y2 C% ?0 k3 `, e

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      : [2 Q8 P* ~4 C/ w( q9 q2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      7 ]+ i2 G4 M4 N" P+ \0 `3 l2 [  l) hcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')' d/ M9 l% G3 F  r
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")
      8 N7 ]4 K1 i0 u( t& V- A2 M2 kfive_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))7 f3 `. `1 @" Z" ], Q- [$ B
      five_country$date<-as.Date(five_country$date)  L: v: B/ G; Q( ^7 T% e

      # k  J% I$ L. K# k! M% @ggplot(five_country, 1 D6 R) s0 z* o+ `
                  aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      7 `, b* _# F4 J& W  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      ) S" d  T# B3 s' j  h8 o  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  3 \3 s+ U: w0 S) D& b
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板' B' M5 G, R/ i) u  F7 P( p2 @
        theme(legend.position="none",6 w( N( O  o) L$ C( B. J
              panel.background=element_rect(fill='transparent'),$ d: l$ S+ a, c+ e/ D
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),/ p$ ?8 E+ M% w$ y- I' G! D
              panel.grid =element_blank(),  #删除网格线
      , `9 a; S5 `$ \        axis.text = element_blank(),  #删除刻度标签
      3 R* q- h3 ?# t) X        axis.ticks = element_blank(),  #删除刻度线
      ; L+ }+ V. i* P7 z2 T  )+
      , F8 A1 z2 \+ [. U' c2 h# g  G  coord_flip()+  ' j: a" Y  F0 ?3 b) z$ f. H; s
        transition_manual(frames=date) +  #动态呈现
      $ r! P  _% T" F( {, ~+ m% r& ]  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  / |; X% G+ G' q. ~* g* f6 |! T
        theme(axis.title.x = element_text(size=15))+
      + B* K! C* K" X- i: e8 t0 ~& P  ease_aes('linear')  
      0 w$ k# c$ B. B1 b7 R7 j9 o$ \" ], u. r% q) j: \
      anim_save(filename = "五国累计确诊病例增长动态图.gif")6 H5 ^- O( n+ g/ F" @9 l7 ?

        n+ T! v9 p! z# _. b1 o  U
      2 B, q. z8 L9 ^: ^
      - z# N) ?/ c- f% A4 T* H
    - c5 D) E- L& [( k
    3 T) q: w$ O. ~
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-2 12:26 , Processed in 0.460655 second(s), 50 queries .

    回顶部