QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6051|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化2 y8 o$ d6 p( M
    目录
    % ~: n& z- G, |& J# B一、数据介绍及预处理
    & Y5 x# ]  |0 x2 X; w7 G! a二、新增确诊病例变化趋势' m4 r: E, D/ p+ @. X$ V  ?
    三、新增确诊病例全球地理分布
      h$ G6 g% E5 u8 U, @1 g四、累计确诊病例动态变化图
    2 [5 G( o# M& w一、数据介绍及预处理
    - Y! m8 [: }: T' {/ r1. 基本字段介绍. j+ J+ K' E- ]( p
    + p- c  Q/ X; q# z7 ?
    字段名        含义; t3 ?9 Y& q3 \8 Z9 v0 \8 O7 X
    Province/State        省/州
    + |  u- E: f5 e. \1 D) j  K/ FCountry/Region        国家/地区
    9 `8 ]/ l5 r7 k# l( H5 ]! pLat        纬度! i+ {( b; i1 A5 J# m1 v
    Long        经度
    ) U0 s" i5 F+ T4 p; Z9 ?1/22/20-12/7/20        每日累计确诊病例! Q! h- ^$ o7 X# V' J9 g

    ! P5 n5 H8 k5 y+ G
    6 ~1 K' W0 r3 p  K+ X0 n/ _
    6 r$ T9 Y& n* O3 J5 C: s

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]9 M* n1 @* g$ a2 h% l" ~) w2 e1 Z6 N
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]4 B: ]1 t0 E/ Z  I7 d1 c
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]
      ( n2 ]0 {) M! ?4 j6 ^# J
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]# I1 s; L7 s+ U! U
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例2 ~6 x$ u- l2 D+ E% y/ K0 G# b
      inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])  |' F. F. ^' I) J  Y  g
      increase_data<-inspect_data-inspect_lag_data
      ) q( ]$ }7 ^4 T: v6 p$ j6 y7 g
      , V: c% m3 m3 j5 [0 {' _! x8 g$ o#合并数据,new_data为新增确诊人数数据
      8 D+ j$ \# A( M2 a" ^& W# J/ @new_data<-cbind(information_data,increase_data)
      + {2 z2 B& |' `: m- x4 E3 [8 }" J! q! j, r0 h3 Q2 p
      1. 中国新增确诊病例变化趋势9 L  }4 \  U  I; u' k3 m
      #合并所有省份新增确诊人数9 J2 ]: G! n  F6 ]& X! I) F
      china<-new_data[new_data$`Country/Region`=='China',]
      0 }" N' @% x: R$ Y; rchina_increase<-data.frame(apply(china[,-c(1:4)],2,sum))
      & G, i4 V3 W  w9 K# n$ v' ucolnames(china_increase)<-'increase_patient'
        W3 H1 U+ e1 ~china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")  R4 H1 e. O" A9 R3 s0 |/ U
      + _! Q6 t6 P" P1 e! r
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+' {" O; N# Y7 U# [
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)! x3 L  D( X% Q7 I- ~
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
      7 Z! G' _! }+ |0 `+ Y- Y) a6 x  theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      ( w$ m, c9 A4 H5 @5 a: q  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),8 g  Q9 j3 o) e9 r" l
              axis.title.x = element_blank(),
      6 p% H& j# m( O! ^1 \  ^$ _        axis.title.y = element_text(size=15),
      4 S/ {( \2 G8 i/ d- @        axis.text.x = element_text(angle = 90,size=15),5 F2 z6 Q8 o3 C% Y- e4 B6 A8 \% s
              axis.text.y = element_text(size=15),/ ?# l$ N0 I1 D% j8 I( ^5 e
              legend.title=element_blank(),0 N! U+ d3 z' y& R7 p! U
              legend.text=element_text(size=15))
      ! w, l3 c$ ^) i' u
      3 w, i$ V& r0 k% s
                                   . d1 V) R& w0 c( l" a
      2. 美国新增病例变化趋势
      4 Q1 Y, Y' f3 F( _1 g5 xus<-new_data[new_data$`Country/Region`=='United States',]1 e* }  x& A3 @6 u) `
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      , J- j& R0 z8 }us_increase$date<-as.Date(us_increase$date)
      4 y. A7 j& }9 K) Pggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+9 Y- r( R2 B% ~" V% r6 [! L! ^# D, x
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天
      / D, [8 p9 }$ Y  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+
      5 r' _( n4 N. }* u# j0 t: ]3 ^  theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      4 b2 G1 E% l7 M1 r  u: R/ N  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
        t; @) I# @0 U$ D1 p' u; e& g: C        axis.title.x = element_blank(),
      4 t( L0 e9 ?' @6 B2 ^" x9 p        axis.title.y = element_text(size=15),+ f& A* R/ `! `8 C
              axis.text.x = element_text(angle = 90,size=15),1 ~1 B! u. \! n1 Z  b3 X
              axis.text.y = element_text(size=15),
      1 M& n% h: N2 h* a        legend.title=element_blank(),9 J" c6 O1 s; U  X
              legend.text=element_text(size=15))& ~6 w( p4 m: u* a% ]$ g

      6 g. z  n: u- ?! a% ?' v6 d* O2 X, a( t- K; ^1 p# N5 Y
      3. 全球新增病例变化趋势
      " R9 B% C7 P% h  a: x4 I2 xtotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))4 d3 W4 S0 U8 y9 r& q
      colnames(total_increase)<-'increase_patient'
      # q5 n6 C: _. [) y  l. Jtotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d"), h& `. M3 R( F0 Z
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      . `7 b1 L: l4 @+ J" X  scale_x_date(date_breaks = "14 days")+- Q* r; K2 L# `- ]$ n
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+
      - M+ Q  P0 i8 h% p1 B  theme_economist()+
      - M$ m0 n$ Y7 E- [0 Z2 m  scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签, T2 F( e1 C/ }1 P
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),  `! V$ D7 l! I1 k/ H! Z
                           labels=c("0","20万","40万","60万","80万"))+
      9 W1 n5 s, @% M# n. r. _' ?  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      3 Y" }7 ^& R3 G( h        axis.title.x = element_blank(),
      1 {1 D0 g5 p- x- q# c( d' ~) T        axis.title.y = element_text(size=15),* o" n: M' `% o2 v8 K
              axis.text.x = element_text(angle = 90,size=15),
      7 M% \5 r9 h4 @. Y6 x: Q        axis.text.y = element_text(size=15),
      - J" u' u3 B3 U7 x        legend.title=element_blank(),( y+ [1 R5 M. f7 _* X
              legend.text=element_text(size=15))
      # P, g2 m1 b+ b
      $ d1 u) n& n! w0 b6 \5 ^0 }
      / R6 V% o( ]! ~8 J$ `9 {
      三、新增确诊病例全球地理分布! {9 J5 ?7 g! E% w
      mapworld<-borders("world",colour = "gray50",fill="white") # X; f1 g0 }* v( K" e6 i. S+ w
      ggplot()+mapworld+ylim(-60,90)+
      : l$ ]6 l' n. b$ Q" P5 w+ n  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+7 v( F2 N+ A% m# u' S
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      % c4 {1 [. _5 `# l3 x1 k  theme_grey(base_size = 15)+
      " j, A) n0 J5 y0 q+ T7 \  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      ; B/ g# T. v" a. H        legend.title=element_blank())9 T8 ?* @9 g/ k) y1 r+ S# U

      ! D  b* k: o& o. hggplot()+mapworld+ylim(-60,90)+6 s. a; R; o2 @1 v$ ~0 x
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+) V. n- D( H% ~' k* ^
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      7 u$ P7 y1 e6 }6 ?  theme_grey(base_size = 15)+
      ! _* Z; t; D; C2 z; v5 n  t  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),: y, G$ I$ @  V7 j3 w* ?
              legend.title=element_blank())
      . d" M+ c7 b, ?8 i+ i+ |. @) @5 q" a4 ~
      0 I7 x7 k. ^: B1 `6 ]! F
      四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      1 i' @& B7 j( J5 f2 I( N) z( u& V+ l* T* q

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      7 u+ `5 p* Q3 J
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图/ ^" i  b+ z* N+ Y$ A
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      : w/ ~, {8 r) c# Y2 [colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")' |$ l8 B% _4 q. M& [& i
      five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      - Q% Q) t! C( Sfive_country$date<-as.Date(five_country$date)
      / q+ O; I! p, U; G$ \4 M9 s7 Q5 J# T/ s- I6 e# T
      ggplot(five_country,
      $ h" u7 P# p* U: w6 @  x            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  
      3 n/ V- Q4 S# y' T( h9 Q6 l  geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  
      $ N2 N1 O, i4 J  geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  8 N4 Y4 g* E- j( c" C. x
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      # r1 Z/ w9 R$ S# R  theme(legend.position="none",! |5 [! K* }9 U" g/ f
              panel.background=element_rect(fill='transparent'),* q2 Y6 w. c4 A5 z% C" G1 d
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),0 D/ x7 n5 j6 G2 I
              panel.grid =element_blank(),  #删除网格线" |* }( }$ Z1 \( `- `# y
              axis.text = element_blank(),  #删除刻度标签8 U/ I: q+ ?/ d9 `' V1 M$ f
              axis.ticks = element_blank(),  #删除刻度线
      " b! P% p% T) \% i2 \- j  )+. h4 ]4 L$ o1 X) k' j* T' G
        coord_flip()+  
      " A/ u$ o! h& g2 H* L  transition_manual(frames=date) +  #动态呈现0 N' X- q# ^2 Q
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  
      / N" V! W( w+ V  d$ a  theme(axis.title.x = element_text(size=15))+
      . [5 n, Y' I2 M  v: f  ease_aes('linear')  
      ; j2 f& \! r6 N: h0 P; S% O. ~& g3 u
      anim_save(filename = "五国累计确诊病例增长动态图.gif")
      5 e  O! x. k% E* v
      ) w6 I6 C+ E4 k0 f5 v2 @
      3 J5 P2 v& r; L, ]$ [  D2 @, i
        F0 B8 p, i4 k
    & o- u0 n1 a% Y9 ?: V( Y: ~

      B) ~5 e- q& J( I0 Y
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 12:56 , Processed in 0.474919 second(s), 51 queries .

    回顶部