QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 6080|回复: 0
打印 上一主题 下一主题

可视化实例基于R语言的全球疫情可视化

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-28 20:34 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
                                   可视化实例基于R语言的全球疫情可视化
      x7 S9 R2 C, x+ w# n8 X8 W目录
    # s2 e4 e( f3 D5 a一、数据介绍及预处理
    & ]7 o' v. {% y; f/ T5 C! M) B& t二、新增确诊病例变化趋势3 j: N: r  r+ W* a' M
    三、新增确诊病例全球地理分布
    6 V9 O, a% O' j5 ?9 Q. w四、累计确诊病例动态变化图: @1 X8 w5 d+ _5 m3 z
    一、数据介绍及预处理* W% ?/ G8 b4 U1 A' y7 b/ }1 r1 m* E
    1. 基本字段介绍4 B# t$ B% j$ b
    # m6 \6 ?( m3 n2 r8 v
    字段名        含义( F& L2 ]- Y1 _; p) P
    Province/State        省/州
    7 z5 b% Z; }; Y, _# YCountry/Region        国家/地区8 [- g8 p! C( g; e6 F! M
    Lat        纬度
    . M( @3 l6 |; ~0 Q% X/ rLong        经度6 f# u$ b/ K6 D3 J+ t/ ~! ?8 D6 r! a
    1/22/20-12/7/20        每日累计确诊病例. x, Q% q* L' Y
    4 W  a6 `3 k% D+ I1 d

    , I7 P9 E% b5 d7 h6 c+ A
    + ~2 s1 m& B5 ?& h0 O% y

    2. 数据预处理

    • 整理某些国家的名称,如Korea, South改为 Korea
    • 将日期列字段修改为相应的日期格式
    • [color=rgba(0, 0, 0, 0.749019607843137)]#加载本次可视化所需包[color=rgba(0, 0, 0, 0.749019607843137)]library(readr)  [color=rgba(0, 0, 0, 0.749019607843137)]library(sp)  #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(maps)   #地图可视化[color=rgba(0, 0, 0, 0.749019607843137)]library(forcats)[color=rgba(0, 0, 0, 0.749019607843137)]library(dplyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(ggplot2)[color=rgba(0, 0, 0, 0.749019607843137)]library(reshape2) [color=rgba(0, 0, 0, 0.749019607843137)]library(ggthemes)  #ggplot绘图样式包[color=rgba(0, 0, 0, 0.749019607843137)]library(tidyr)[color=rgba(0, 0, 0, 0.749019607843137)]library(gganimate) #动态图[color=rgba(0, 0, 0, 0.749019607843137)]
      5 Z, H9 K1 k1 m
      [color=rgba(0, 0, 0, 0.749019607843137)]#一、国家名词整理[color=rgba(0, 0, 0, 0.749019607843137)]data<-read_csv('confirmed.csv')[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='US',]$`Country/Region`='United States'[color=rgba(0, 0, 0, 0.749019607843137)]data[data$`Country/Region`=='Korea, South',]$`Country/Region`='Korea'[color=rgba(0, 0, 0, 0.749019607843137)]
      - j, E2 J( n* N) j7 f- |
      [color=rgba(0, 0, 0, 0.749019607843137)]information_data<-data[,1:4] #取出国家信息相关数据[color=rgba(0, 0, 0, 0.749019607843137)]inspect_data<-data[,-c(1:4)] #取出确诊人数相关数据[color=rgba(0, 0, 0, 0.749019607843137)]! l% q- I+ n/ |$ }4 O7 C
      [color=rgba(0, 0, 0, 0.749019607843137)]#二、日期转换[color=rgba(0, 0, 0, 0.749019607843137)]datetime<-colnames(inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]pastetime<-function(x){[color=rgba(0, 0, 0, 0.749019607843137)]  date<-paste0(x,'20')[color=rgba(0, 0, 0, 0.749019607843137)]  return(date)[color=rgba(0, 0, 0, 0.749019607843137)]}[color=rgba(0, 0, 0, 0.749019607843137)]datetime1<-as.Date(sapply(datetime,pastetime),format='%m/%d/%Y')[color=rgba(0, 0, 0, 0.749019607843137)]colnames(inspect_data)<-datetime1[color=rgba(0, 0, 0, 0.749019607843137)]
      2 S9 y6 P9 u6 |2 f. w, z# j4 w
      [color=rgba(0, 0, 0, 0.749019607843137)]#合并数据,data为累计确诊人数数据(预处理后)[color=rgba(0, 0, 0, 0.749019607843137)]data<-cbind(information_data,inspect_data)[color=rgba(0, 0, 0, 0.749019607843137)]二、新增确诊病例变化趋势#由累计确诊病例计算新增确诊病例
      $ U, e$ F) J* ?$ `inspect_lag_data<-cbind(0,inspect_data[,1ncol(inspect_data)-1)])
      ; b8 y! x' m1 `increase_data<-inspect_data-inspect_lag_data
      5 Z8 M# c( y* ^& o
      1 Y. c6 I1 h2 U% D8 {6 }6 L; a#合并数据,new_data为新增确诊人数数据7 ]% O' r- `7 ~; G7 l
      new_data<-cbind(information_data,increase_data)
      * ~# k, ]+ ?: U" ]8 K' p9 W) l. a8 h, u( A
      1. 中国新增确诊病例变化趋势
      ' X* {! E: z9 |  I#合并所有省份新增确诊人数' s; V: W+ f/ w* {
      china<-new_data[new_data$`Country/Region`=='China',]
      ; E7 L  M: L2 g* ]6 ?china_increase<-data.frame(apply(china[,-c(1:4)],2,sum))
      9 w$ O* e8 q+ Z1 J( y, O7 T# Scolnames(china_increase)<-'increase_patient'
      # h  v- W/ k5 R9 |0 s3 Uchina_increase$date<-as.Date(rownames(china_increase),format="%Y-%m-%d")' {9 L, d8 W! H5 a& F9 k9 a9 l
      3 K/ h, N! U4 w; Q
      ggplot(china_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+3 D$ u2 s; t" H. E" t! u" l
        scale_x_date(date_breaks = "14 days")+  #设置横轴日期间隔为14天(注意:此时的date列必须为日期格式!), L% a, A4 I: Y1 q. B9 V/ V( {
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日中国新增确诊人数变化趋势图')+, y6 H! H, A$ J2 n& S& s6 p7 P
        theme_economist()+  #使用经济学人绘图样(式ggthemes包)2 Q- [( O& |4 q
        theme(plot.title = element_text(face="plain",size=15,hjust=0.5),& l7 ?+ P) u( l( ]7 h0 E
              axis.title.x = element_blank(),( I6 h6 [+ M$ u) b, a
              axis.title.y = element_text(size=15),* R/ j0 M( ]- ]  _- j
              axis.text.x = element_text(angle = 90,size=15),, M. v& H* U1 `9 V1 x5 k
              axis.text.y = element_text(size=15),
      8 p; D% |- y# Q3 h4 o        legend.title=element_blank(),/ ~4 G. Y% f) ~% ]7 [3 \
              legend.text=element_text(size=15))' ^0 m# g/ r  q- P& r7 ]+ m
      8 R6 M+ x8 Q2 {# ]3 u0 _  V% w
                                   + i4 r. p4 z" A4 h
      2. 美国新增病例变化趋势
      0 l( Z& M6 t! \  \0 }us<-new_data[new_data$`Country/Region`=='United States',]* y5 n8 l. X9 M! M/ i0 D- r- ?* c
      us_increase<-gather(us,key="date",value="increase_patient",'2020-01-22':'2020-12-07')8 D8 w4 U# O6 O
      us_increase$date<-as.Date(us_increase$date)
      & A7 t7 O8 x& W# z7 x4 sggplot(us_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+
      1 c/ G) k  z, F' o  scale_x_date(date_breaks = "14 days")+   #设置横轴日期间隔为14天+ D2 }0 U& i2 w% `( s. y1 k0 y2 w1 F
        labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日美国新增确诊人数变化趋势图')+6 p1 v( r2 m5 c
        theme_economist()+   #使用经济学人绘图样(式ggthemes包)
      8 g4 D, C( J. O. t8 ?7 q" X  theme(plot.title = element_text(face="plain",size=15,hjust=0.5)," j& F4 n" }  j& G# @) o. Z; g
              axis.title.x = element_blank(),$ k& V) n7 F6 M8 h, O/ ^+ S; [* h
              axis.title.y = element_text(size=15),
      0 W9 r* ]1 `% u7 V! V) g2 g6 [4 Q        axis.text.x = element_text(angle = 90,size=15),
      . F" d* d% W0 Y9 [6 T( @        axis.text.y = element_text(size=15),
      + R% n3 K" R3 y1 d- V' F# o        legend.title=element_blank(),; i, N2 q4 j3 I1 M" Y1 p' {
              legend.text=element_text(size=15))0 V% C) o$ n" n, G# w. o9 p/ i

      6 ^. N' V7 z5 p% T( c0 p/ x- N. u$ w$ v: Q
      3. 全球新增病例变化趋势
      " ]7 F& u! t: q. u! E* Ctotal_increase<-data.frame(apply(new_data[,-c(1:4)],2,sum))7 P8 b: z0 M# D/ g/ ]  k
      colnames(total_increase)<-'increase_patient'
      % e, a2 k  y! Y8 X  ]+ ]total_increase$date<-as.Date(rownames(total_increase),format="%Y-%m-%d")5 e; i) L. Y; @/ ]: h
      ggplot(total_increase,aes(x=date,y=increase_patient,color='新增确诊人数'))+geom_line(size=1)+! Z3 o' x& V* K7 q0 M* h
        scale_x_date(date_breaks = "14 days")+
        @  k. i. F# s0 n  labs(x='日期',y='新增确诊人数',title='2020年1月22日-2020年12月7日全球新增确诊人数变化趋势图')+
      ' t9 u; t  d7 S" m+ k: r  theme_economist()+  n7 x; {4 i4 N9 U& I! ]4 O
        scale_y_continuous(limits=c(0,8*10^5),      #考虑数字过大,以文本形式标注y轴标签
      , N, V) ]: s1 d  I  ~                     breaks=c(0,2*10^5,4*10^5,6*10^5,8*10^5),0 C+ J$ w3 e, C
                           labels=c("0","20万","40万","60万","80万"))+
      - X" J6 t6 T, u* \/ D4 P  theme(plot.title = element_text(face="plain",size=15,hjust=0.5),
      3 M; o# e) n9 S: K  n2 c( B2 c* O        axis.title.x = element_blank()," [7 T+ l& E, \0 L7 A% R% }
              axis.title.y = element_text(size=15),) P/ ~- a8 z' F% e0 K
              axis.text.x = element_text(angle = 90,size=15),
      ! `  k' L0 v/ ]        axis.text.y = element_text(size=15),5 N& ?7 S0 J0 x9 C, m" l
              legend.title=element_blank(),2 W( r( [* Q( |! O. ]5 x( P
              legend.text=element_text(size=15))
      $ O* n: G+ N5 @6 A0 [
      - u) l( {/ @+ G# J# X8 X

      0 g( R& C6 \$ J8 ^% b5 J6 f5 p三、新增确诊病例全球地理分布
      - |6 T- u- x- w/ xmapworld<-borders("world",colour = "gray50",fill="white") . X1 s" q# A- [! }
      ggplot()+mapworld+ylim(-60,90)+
      0 @, ?0 a9 _4 S  ?  geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-01-22`),color="darkorange")+$ C" w* C, ~& ^4 H8 i+ L9 k2 a
        scale_size(range=c(2,9))+labs(title="2020年1月22日全球新增确诊人数分布")+: ]1 |( Y0 |8 x
        theme_grey(base_size = 15)+4 T% `8 J1 R3 G8 r8 i. j
        theme(plot.title=element_text(face="plain",size=15,hjust=0.5),& `7 F5 Z% |4 @* F0 M
              legend.title=element_blank())
      ! U4 }* A7 |, j$ c8 e6 _+ w) Y! f4 J6 ~' {0 J
      ggplot()+mapworld+ylim(-60,90)+- o- F7 V' U+ ]$ a) H
        geom_point(aes(x=new_data$Long,y=new_data$Lat,size=new_data$`2020-11-22`),color="darkorange")+- U* T/ ]5 @% \  o) P9 v( i+ X
        scale_size(range=c(2,9))+labs(title="2020年11月22日全球新增确诊人数分布")+
      5 ?4 T0 R+ l3 d  theme_grey(base_size = 15)+
      4 o" \3 p& U) ^6 B; E! o: W. @  theme(plot.title=element_text(face="plain",size=15,hjust=0.5),
      ) {2 r  U: t% M0 @        legend.title=element_blank())# Y& i: u3 o2 c

      1 s6 I) x3 F# `" u3 H
      ) v% Z, V( Q& E0 |4 O$ v# K四、累计确诊病例动态变化图

      1. 至12月7日全球累计病例确诊人数前十国家


      0 B7 n0 d1 e5 l8 X

      cum_patient<-data[c("Country/Region","2020-12-07")]

      cum_patient<-cum_patient[order(cum_patient$`2020-12-07`,decreasing = TRUE),][1:10,]

      colnames(cum_patient)<-c("country","count")

      cum_patient<-mutate(cum_patient,country = fct_reorder(country, count))

      cum_patient$labels<-paste0(as.character(round(cum_patient$count/10^4,0)),"万")

      ggplot(cum_patient,aes(x=country,y=count))+

      geom_bar(stat = "identity", width = 0.75,fill="#f68060")+

        coord_flip()+  #横向

        xlab("")+

        geom_text(aes(label = labels, vjust = 0.5, hjust = -0.15))+

        labs(title='至2020年12月7日累计确诊病例前十的国家')+

        theme(plot.title = element_text(face="plain",size=15,hjust=0.5))+

        scale_y_continuous(limits=c(0, 1.8*10^7))

      " W3 K2 H4 m+ @9 M% N1 T  }: r1 ?- g
      2. 五国(India、Brazil、Russia、Spain、Italy)累计确诊病例动态变化图  n8 \# D! D4 i: i- t
      cum_patient_time<-gather(data,key="date",value="increase_patient",'2020-01-22':'2020-12-07')$ r6 p  h- j3 o" J' [
      colnames(cum_patient_time)<-c("rovince","Country","Lat","Long","date","increase_patient")2 Z" U' Z2 s, C+ W
      five_country<-subset(cum_patient_time,Country %in% c("India","Brazil","Russia","Spain","Italy")), }- d5 c3 @8 R0 _- w& m
      five_country$date<-as.Date(five_country$date)
      7 e) g, T* @7 s/ T" Z7 p1 w" K" L+ F
      ggplot(five_country, * J: s% J% L- n
                  aes(x=reorder(Country,increase_patient),y=increase_patient, fill=Country,frame=date)) +  1 ~2 g' h% O6 j5 f
        geom_bar(stat= 'identity', position = 'dodge',show.legend = FALSE) +  # h# }3 i) `( _* L9 j( Z
        geom_text(aes(label=paste0(increase_patient)),col="black",hjust=-0.2)+    @* M" x/ y' Z  i
        scale_fill_brewer(palette='Set3')+  #使用Set3色系模板1 m; K5 ]* U1 p6 R
        theme(legend.position="none",; n9 F1 D) c( }5 D: F
              panel.background=element_rect(fill='transparent'),0 _5 z" R8 D. h( y$ L' N& X0 V" B
              axis.text.y=element_text(angle=0,colour="black",size=12,hjust=1),
      : `" L  U  p7 J        panel.grid =element_blank(),  #删除网格线
      9 q1 V/ K0 T/ D" V: h. v        axis.text = element_blank(),  #删除刻度标签
      5 C: S9 e% S! o" @        axis.ticks = element_blank(),  #删除刻度线! v- l& c* @2 j( m' _: B) A
        )+
      ) }9 ^: K% g) Z% W5 C" E  coord_flip()+  ( i! h+ h' n4 x3 X- f* t" \2 j
        transition_manual(frames=date) +  #动态呈现
      % \- V/ `) y2 N  x0 ^% b  labs(title = paste('日期:', '{current_frame}'),x = '', y ='五国累计确诊病例增长')+  9 [- G9 m) ]9 f, q1 w0 L
        theme(axis.title.x = element_text(size=15))+
      ' `; q5 C2 e% U. y* n  ease_aes('linear')  + h% y$ L$ I+ T

      % B) z8 W9 D# ]: A1 Fanim_save(filename = "五国累计确诊病例增长动态图.gif")( u& w/ N4 [9 j/ _2 H
      - c! K% U/ Y9 D/ ]

      2 L' M' s% w  i; ^3 e, j9 ^' f' z  F. f8 u4 ]
    . K7 A4 c9 E+ |" O1 g

    0 }5 Z0 s& [* m7 S# [
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-4 04:58 , Processed in 0.440336 second(s), 51 queries .

    回顶部