QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5768|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
    / m4 ~/ k; D9 x9 _1 M; n- F& q目录* @2 d0 Z( a* P: I, |3 [
    一、数据介绍及预处理
    0 T# U' `; e* V) l1 f$ A( W二、新增确诊病例变化趋势9 d6 Y2 j) i7 O) o/ i
    三、新增确诊病例全球地理分布/ S3 f7 _7 W0 e8 e
    四、累计确诊病例动态变化图
    / p& R. Z% O6 }$ u* x8 u一、数据介绍及预处理" `+ t4 N: F' u
    1. 基本字段介绍$ F9 j0 @6 A/ `6 o2 x7 @0 M- j

    2 M# A$ \/ J2 v. T字段名        含义: N# }  |! e" O2 o% J, _% @2 @
    Province/State        省/州! N6 f9 ?9 M4 H
    Country/Region        国家/地区
    $ \. T, ~' P" b) x# j5 d* d; y- j4 ULat        纬度
    # e! O1 i7 }! B! f9 VLong        经度
    ( Y$ ]$ W( T4 r! k6 H1/22/20-12/7/20        每日累计确诊病例0 ]1 c1 E9 _" E9 }- A! N

    # [  k2 F) W9 A' \' h) e0 W; q) ]6 O* u, X
    ! R* R% S" e  l+ ~0 A

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]9 B+ |5 f6 N6 H* p
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]( ^1 A' F! a* k" f* L& J2 u3 ]/ a0 J
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]& |% C! e+ @/ Y+ I+ E
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]+ s" I! J2 f( g# d& \! G: Q
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      . Y4 R% d% x5 j, S. [3 w. Z9 jinspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)]): }( u( M& T( Z( C2 Z
      increase_data<-inspect_data-inspect_lag_data
      1 M9 o1 N/ h. V; j, q4 A  J. L% s5 e% `% _' T. C5 F" f# P
      #合并数据,new_data为新增确诊人数数据+ I2 d4 c+ R7 l# [
      new_data<-cbind(information_data,increase_data)
      9 s6 V7 ?( V# E
      - C6 m7 X' E! d- o, J1. 中国新增确诊病例变化趋势
      . z+ `; ]4 E) L6 _#合并所有省份新增确诊人数
      0 F2 e" _1 ~7 z2 M. F( g& Lchina<-new_data[new_data$`Country/Region`=='China',]. `* N4 P* X2 w5 H' ]3 u
      china_increase<-data.frame(apply(china[,-c(1:4)],2,sum)): Q+ ?+ b, N! s/ ~( h# N  Q% k+ h
      colnames(china_increase)<-'increase_patient'9 B, q1 M$ i& c7 `$ t
      china_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")
      9 I( h  }  @" X* G: f, t* P; r" T& C- l4 P1 f& Y& q4 n& x% O4 `
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+) {" r6 ~- `7 I, p9 N0 r$ H
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!)
      0 v+ R7 |8 ^+ \* ]+ |0 G/ z) ?- K  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+
        t8 ^9 \: y% R8 _  theme_economist()+  #使用经济学人绘图样(式ggthemes包)
      , @: d2 a; Q. Y2 d/ n9 ]0 T6 q1 c  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      1 I! W, r7 _' w- C' r0 S  j" d, B        axis.title.x = element_blank(),
      6 @! d: N4 G' d( R9 r        axis.title.y = element_text(size=15),
      0 I! t5 ~$ F# s0 A! {0 y        axis.text.x = element_text(angle = 90,size=15),
      , ^# m" Y6 E; I- z" d; o        axis.text.y = element_text(size=15),5 h& Q0 F1 E# |( D+ R  p
              legend.title=element_blank(),
      8 _8 M( J8 y( b" V, F/ ^2 i        legend.text=element_text(size=15))
      2 b' q2 X* s$ j$ Y4 V& j* X$ U9 @
        c- T! ~7 \4 T4 ~' F2 h
                                   + k" s# n6 P- E, }5 P1 g5 r. ]5 C
      2. 美国新增病例变化趋势8 B7 W8 A+ `$ m. g1 b
      us<-new_data[new_data$`Country/Region`=='United States',]' _* T/ G7 k, R8 q* d
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')2 L2 z+ s1 ]5 N4 x
      us_increase$date<-as.Date(us_increase$date)
      ; |) u* `1 R- t; {# Iggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+* D" ^2 g1 i: W7 v. I, y- K
        scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天1 K' t  N9 c1 _2 L, ~/ }7 }" z+ p
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+& r, L0 G1 q+ P. _9 S/ _( ?) A9 _
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)" i( h/ m# i( @4 E
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      * v0 L& e( Q- F  O; @7 i        axis.title.x = element_blank(),
      2 W: U0 @1 d4 E9 N        axis.title.y = element_text(size=15),
      $ {  t  d% W# I) c        axis.text.x = element_text(angle = 90,size=15),
      ; w9 Y. f6 k+ Z# F, |6 o        axis.text.y = element_text(size=15),+ _4 {8 y% @( q! O7 A- ?& I2 p8 q+ M' I
              legend.title=element_blank(),
        a4 U" z3 r+ R+ t  J        legend.text=element_text(size=15))
      & F, b! \' n$ c( b- F

      " e% h( E$ f+ E) @- ]6 T
      ( y7 ?$ G! F" Q3. 全球新增病例变化趋势6 q4 k1 ]; D$ q3 `) M- G
      total_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))4 D' e. Y: ^& T) O) q$ {$ C  C1 U
      colnames(total_increase)<-'increase_patient'
      , l- M* v! n( D1 q2 F7 vtotal_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")! U  w% M$ i& Y" x* j" o
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      # K8 M# u8 O0 p) r: l$ y  scale_x_date(date_breaks = "14 days")+% B5 O( `2 g- R/ G
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')++ |" h' ?/ G' ?$ P2 F* j; z' ~) X
        theme_economist()+
      0 c1 U; p$ W: T; r# X  scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签. e5 Y( @0 Q* n
                           breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),9 A9 e) w/ t, H- I. b
                           labels=c("0","20万","40万","60万","80万"))+
      $ O0 @5 m! [5 F" ]$ H% g. l2 R  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      9 \* |$ R9 X8 p: [        axis.title.x = element_blank(),
      , k4 R! x; T- i' j        axis.title.y = element_text(size=15),3 h& E1 @- U% N; s8 S8 I4 y( E
              axis.text.x = element_text(angle = 90,size=15),& R: P, i1 f# o/ Y& r
              axis.text.y = element_text(size=15),+ S3 [7 }5 H& I8 E) T, J5 f
              legend.title=element_blank(),
      $ L. _* ]5 ]9 a  C1 S: _        legend.text=element_text(size=15))7 K) u# O( e+ C0 t8 f/ |, h

      8 t( R8 m. {- z1 a, a$ k" B9 m# b; b7 Z
      三、新增确诊病例全球地理分布
      + s- l9 V& n% pmapworld<-borders("world",colour = "gray50",fill="white")
      ( ^7 X; O. _. N/ j1 J: mggplot()+mapworld+ylim(-60,90)+
      5 K5 V- ?( Q, a/ k5 w& s. N  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+* j% T  ]& j% l5 {! |0 E2 z
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+
      9 d. M  _6 o- h4 ?  theme_grey(base_size = 15)+
      ! }4 f, |5 k5 B' L& W7 V" {  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),; ?( f2 `+ L! @% a" U- G
              legend.title=element_blank())
      ; z8 n/ z1 U# r1 [8 b
      # \1 c2 l: {$ I3 m' Y6 q3 Cggplot()+mapworld+ylim(-60,90)+
        N9 p7 ?# S5 t  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+
      ) k5 l3 n, [% o4 x" z9 i  scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+4 a! |5 n& X2 z: l( ?
        theme_grey(base_size = 15)+. j& S( B- O' r
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),2 N# O3 U2 K' ^. K; V0 I6 D1 Q; X* x4 w
              legend.title=element_blank())2 C' {, Z, g* q, G/ n! y' H

      ; u0 G: E6 C- T: [$ S' V
      1 f% w: j3 o0 |6 J四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家

      1 Z; D2 X% w2 k, ~

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))


      % e( S" F9 y1 d& l; a2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图
      + I3 H" e7 ~* b# hcum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')
      ) |$ o, m1 j" Y% |colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")" i  s' a2 I% D: ~. b# ~+ l" y. I
      five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy"))
      . x: j$ {2 ^6 dfive_country$date<-as.Date(five_country$date)
      5 J! |0 y+ G7 ?% b* F  T& j! m0 L$ P
      ggplot(five_country,
      + S, Y2 a, G: ]4 q8 R  g            aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  $ S" h7 I! W, h! z% x+ P5 r8 v2 e
        geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  ( p6 _6 T; W0 V: ~7 h5 ^+ o& T
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+  
      / G, g! c9 s% ?  scale_fill_brewer(palette='Set3')+  #使用Set3色系模板
      5 M$ \/ \7 j" }1 x' X+ z, f  theme(legend.position="none",; o5 X( k# V) G
              panel.background=element_rect(fill='transparent'),
      ( `8 [& i4 A+ W& c        axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      8 I) O& }) ^, |1 }        panel.grid =element_blank(),  #删除网格线1 a2 |$ Q  U4 q; C
              axis.text = element_blank(),  #删除刻度标签
      & N& o2 _% u! L- a7 v. P        axis.ticks = element_blank(),  #删除刻度线
      * x1 x8 j3 d7 ]  )+5 T  _4 [$ e0 b& h  U  J( ]1 j3 h
        coord_flip()+  
      + h9 X8 S, ^* x  transition_manual(frames=date) +  #动态呈现+ y1 Z1 B' w4 }% d0 l- p) D
        labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  & n: \' N/ F& R( ?1 ~" O+ g
        theme(axis.title.x = element_text(size=15))+
      ! i! g8 e; w2 ^' l' `: e  ease_aes('linear')  + i, ]9 l+ }2 L$ _8 v3 L

      3 o: \5 H' q: V& Z, J7 ?anim_save(filename = "五国累计确诊病例增长动态图.gif")
      4 Z  Z! q/ V+ ^4 X
      ' j* z. J$ q6 t6 R% q) A
      1 Q7 L& W) ~/ _$ M8 n/ Z0 j4 h

        z2 T  g$ K$ q$ x$ n3 s* B% I

    * N$ t+ s0 G% O7 f: `# `  n( u
    5 g4 Z' O2 C1 S/ i( \# r/ m
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-9-29 01:04 , Processed in 0.394576 second(s), 50 queries .

    回顶部