QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6053|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化" o! X7 \5 {1 y2 R
    目录
    0 }6 X! I+ I1 P一、数据介绍及预处理; e3 b+ X1 a) z9 ~, S$ T
    二、新增确诊病例变化趋势: p! r! ^* c" C' \1 p) D6 v' p
    三、新增确诊病例全球地理分布( w) ~0 j" X) n2 d" g+ e
    四、累计确诊病例动态变化图# R5 {: a" ~6 F$ C4 i$ ?
    一、数据介绍及预处理
    3 u/ _: m4 O  F7 u- i1. 基本字段介绍
    & O+ i) W5 B: A* V7 D) q8 p; `" |) ^2 z' q6 p& X: O
    字段名        含义' x# `/ [' ?8 m$ f8 I' G
    Province/State        省/州
    ( f9 G8 h/ u3 nCountry/Region        国家/地区
    # G* }8 G! ], M( q! ]; P  J8 X% NLat        纬度6 `# O# U: T7 Z7 Z
    Long        经度( S6 L. y1 d( g5 b' k) L9 j
    1/22/20-12/7/20        每日累计确诊病例, ?( Z7 Y; d' X: j
    ! F& S, _9 Z/ F1 N" {8 _% ]9 M0 V" Y
      H; _/ \4 d& m9 a

    ! ^. w* g* {' e; z" f

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      ' l' ?, K) J. }# [) K
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]3 Y! ~9 H& f  Q* G$ u6 t% u; O6 m' |
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      # G. g5 j! S- I: R
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      " ~8 f! m0 V* r1 h+ O9 U3 W. j/ H
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      / B% a, f- A/ ainspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])% ]+ Z( Z0 r! f# w' n4 v: _
      increase_data<-inspect_data-inspect_lag_data
      : T: R! \" x9 a. b, z5 d; U% j: L# @4 r/ G5 A" p* K* T; Y6 F
      #合并数据,new_data为新增确诊人数数据6 i$ b# p2 P7 S" b% d3 j
      new_data<-cbind(information_data,increase_data)
      ( Q$ B. y! t+ c  Y2 s+ e* z5 s4 g( v
      1. 中国新增确诊病例变化趋势  u- m1 H5 K# M# G
      #合并所有省份新增确诊人数) _8 c: o# t, p2 ~# C7 d- \" n
      china<-new_data[new_data$`Country/Region`=='China',]
      $ ]% p' T+ U7 c& o$ `- [china_increase<-data.frame(apply(china[,-c(1:4)],2,sum)), l' j& D0 I' G* K6 Z9 v
      colnames(china_increase)<-'increase_patient') u% W5 K9 O7 A/ ~- e
      china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d"); B1 G& i8 X8 i
      ' \; w7 K. M# \8 L7 Q+ G
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+' z  \$ O9 z$ i4 K* m
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
      & I# ]$ y2 T0 h& d) l+ j9 g  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+# {6 d. x  ~! J* b$ b. ]3 Y5 A
        theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      - k8 G: v9 G% [: l% x& a3 D  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      * D3 k/ P+ k- o% p        axis.title.x = element_blank(),9 I2 u( s$ z; y9 \  I% Z
              axis.title.y = element_text(size=15),. A1 A' j4 }1 w+ B, v: f
              axis.text.x = element_text(angle = 90,size=15),
      / k! U2 x3 w9 T# u        axis.text.y = element_text(size=15),
      " f  y8 d( B# o0 h& M6 m        legend.title=element_blank(),- N7 Q; q3 G& a5 N
              legend.text=element_text(size=15))
      . d4 x: ~# R9 f9 O3 s* L' }! [

      + e& L) B* C8 V! n0 O                             
      ' d+ s. }6 t5 r2. 美国新增病例变化趋势+ a+ U" ]. G. \8 _2 E% [, P* H) h
      us<-new_data[new_data$`Country/Region`=='United States',]
      1 |* e& }  U, d7 R: O/ \9 S$ Bus_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      . x( Q5 R2 y' C1 B& i9 tus_increase$date<-as.Date(us_increase$date)
      & w9 L& F) O6 j) T* `) xggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+' h$ {+ j' h9 Q3 w
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天, a7 _8 d2 J. c6 d: }$ e
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+/ U- T$ S! a, |, h: q
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)) c7 s' s& ?! M7 r
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      1 f& `3 I* J! I2 m        axis.title.x = element_blank(),
      7 d) o, T, i4 M& @" w1 q1 J$ H        axis.title.y = element_text(size=15),
      9 _. V2 O; A7 b# g6 p& u# ?        axis.text.x = element_text(angle = 90,size=15),
      $ n2 s0 g* v) u/ c        axis.text.y = element_text(size=15),2 c) y: D% x5 Y5 b; i3 ^. ?5 M, _; A
              legend.title=element_blank(),
      " A6 p" E3 i; q; _" y; m- b        legend.text=element_text(size=15))
      + C. {6 b& m* Q2 o6 e' U, Z+ z

      : y1 o3 g- C' W' l
      8 z* ~. B# d/ M+ w1 j3. 全球新增病例变化趋势
      0 U! V( q. g$ P- I' v; A' f! Q- atotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))5 q7 L# V9 w. L* }' a, Z1 G* N
      colnames(total_increase)<-'increase_patient'# g# h, e( {# H$ Y  q
      total_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")
      ! K' C% c' x% D8 Uggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      0 k- T0 z3 v0 ?7 d3 [  scale_x_date(date_breaks = "14 days")+
      " J. E1 x6 n# K  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+7 Q$ z& @3 H+ W, j, `, s) z& f
        theme_economist()++ c- V8 P/ z3 P4 J
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
      . d% ]: x# t2 ~4 ~1 b                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),: ?4 m8 \, h+ u# M
                           labels=c("0","20万","40万","60万","80万"))+: t0 k* \: c  g2 V# B' o0 s
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),5 d% _3 w) g+ r# m
              axis.title.x = element_blank(),& {# K2 ~$ Q- H7 J" ]& i$ h: f
              axis.title.y = element_text(size=15),
      , O& ?, j/ i8 S        axis.text.x = element_text(angle = 90,size=15),
      0 X4 t9 c) E/ B; y3 J3 V        axis.text.y = element_text(size=15),
      ! R: t/ e" M: d% q1 A( T) ~        legend.title=element_blank(),
      $ m, v& q, u7 p. |        legend.text=element_text(size=15))5 V8 _1 g1 W# A6 m7 o% s' d. n  E
      ) G& J# I8 V! J9 t' K
      1 H! X* ^* }4 h; H: ^$ o
      三、新增确诊病例全球地理分布7 a5 h$ i) Q, }2 O8 B- g
      mapworld<-borders("world",colour = "gray50",fill="white")
      & e- H3 z. b5 ~# ^7 Xggplot()+mapworld+ylim(-60,90)+
      % o9 h1 m6 K/ N: N  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+
      " @( y. ]0 l* Z; r+ Q! t  scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      ! c. N/ w) |' L$ C, a+ r) j  theme_grey(base_size = 15)+; }. V1 n) V& M0 v2 g
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),& b$ v) X2 C6 o6 C  N0 g9 e
              legend.title=element_blank()). T! N" G# t% q# A$ p8 u

      # Q2 j  E. W" }$ e7 I" T6 |ggplot()+mapworld+ylim(-60,90)+
        f& ^! R& F9 T) T- T  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      - x8 L, S* _. w/ A  D4 h/ T1 g, h  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+2 S7 X6 Y7 o& Z6 e$ E  g* X
        theme_grey(base_size = 15)+" p: M9 K/ I$ o/ m) Y2 _
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      + r2 i  Q, ]1 S7 c; h; {) x        legend.title=element_blank())
      % P, C1 I/ O+ i. q3 }, [% n2 y# n) \( o. j6 t: o! h

      / X5 a, x& N9 j" C& Y四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      " X) M* D; x3 F! ?, G  }' Z# x

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      " g% `/ \% H9 m
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图# d7 R  _9 }) P7 l0 r
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')1 [# I; \1 P  d8 t. R. ?6 k, z0 s
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")& @& R9 O) ^  o% |2 @* v
      five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      * l: r4 @: f. {, l2 Hfive_country$date<-as.Date(five_country$date)
        s" @. R6 E1 v8 t+ {+ Y$ M9 j8 y; G# N: w- K% G* O6 i( h
      ggplot(five_country,
      7 P! b3 z( l. {& @' L            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      . Z0 @$ S+ c7 @  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      ( u8 @6 w  S( u# z( B; G  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  & S' o1 M2 R/ t* Y: a
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
        y7 f2 v/ F* G' c8 z  theme(legend.position="none",
      : ?5 R6 V5 o" X. B: ~, I        panel.background=element_rect(fill='transparent'),
      * d+ ]! S/ A1 ]4 v6 b        axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),% p' p% l" N2 k2 Z& J  F
              panel.grid =element_blank(),  #删除网格线
      & a* W& ?9 Y* X! W3 G: |: @        axis.text = element_blank(),  #删除刻度标签) _* L3 X5 Z) g+ j( _" d
              axis.ticks = element_blank(),  #删除刻度线* m6 I6 A6 Y  Q8 U  {# Y! D
        )+
      * g& t1 Y- y( `( J% W; h  coord_flip()+  
      * e, r* `5 g+ G6 f! b% Y, \& i  transition_manual(frames=date) +  #动态呈现
      ( a% _* o* r! O# ^3 h; B: p  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  " D: A2 i$ S5 A; O' C
        theme(axis.title.x = element_text(size=15))+8 |3 T. [- p0 e$ j( i
        ease_aes('linear')  " l6 y. }# h; J5 q

      4 G  G" e7 s! f% a) I) kanim_save(filename = "五国累计确诊病例增长动态图.gif")" g- Z/ t6 Y: V, w

      % x, O' ]) ~2 {/ |  s% w: E6 ?  L/ z- y, i0 n
      ' `# Z* Q4 g2 X3 ], [
    3 ^( o$ j6 H, S+ ?  v
    0 [. X" ~. g$ g3 w% [6 E
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-21 00:39 , Processed in 0.421744 second(s), 50 queries .

    回顶部