《R语言入门与实践》第十章:向量化编程
% v# O }+ }# q3 g3 c1 V前言 利用 R 的三大法宝: - 逻辑判断
- 取子集
- 按元素方式执行' E4 |1 X4 S& j P# c( C- a+ K7 B
来达到编写高效的代码的目的./ c5 H4 i5 m o. E
这样的代码的特点是可以接受整个向量作为输入,并同时处理向量中的元素./ p7 g1 d" U* i' s; K1 w
通过以下几个案例来阐述向量化编程 预备知识rep() 函数格式: rep(c(-1, 1), 5000000)
0 H- v7 V: z2 A# @; X功能:接受某个值/向量以及次数,返回该值/向量的重复执行次数长度的更长的向量 system.time() 函数格式: system.time(function(object)), H3 ]8 N; a P2 k
功能:输入一个语句,返回执行该语句所耗费的时间. 向量化代码向量化代码的定义可以接受一个含有多个值的向量作为输入,并且同时操作向量中的每一个元素 如何编写向量化代码原则: - 尽量使用向量化的函数来完成任务:比如使用 R 库中的原函数
- 对于重复的情况,使用逻辑值取子集的方法,而不是 for & if 的方法.
( K4 O( L8 E' M( h- J 方法一:使用向量化的函数/查找表程序①——未经向量化 change_symbols <- function(vec){' D; M0 d; P0 A' i% D; v
for(i in 1:length(vec)){' ?( j4 T6 ]& z7 V3 u6 G
if(vec == "DD"){
; U. |: l5 o9 b9 M9 Kvec <- "joker"
8 k& q' N5 x; q f0 \0 d}else if(vec == "C"){
. k: K! Z6 `$ f; F6 b- Svec <- "ace"
9 c+ Z' d$ B0 I}else if(vec == "7"){# j7 o5 M+ j D- k. a G9 z3 d
vec <- "king"
9 G, @9 C# s7 \' n' E" m: C' J( x}else if(vec == "B"){
% Q4 `' M, n, l' zvec <- "queen"
8 b4 Q! f& X; c8 U, b! w& |}else if(vec == "BB"){ M. F3 h" e4 @
vec <- "jack"- y7 Y5 v3 j0 x3 ~8 S9 h8 ?% ] a! F
}else if(vec == "BBB"){% q) A2 J2 O$ @( j/ w% Z v
vec <- "ten"2 ^; {5 z9 [0 Q
}else{" g7 `% {9 ?4 Q) I0 q" Q& N! j
vec <- "nine"3 l* D2 I" G& U, n
}
; g9 Q5 w3 D @: k. p' O/ l& e9 y}
' Q6 R; ^, T8 Q" S; g/ kvec
8 ?' t3 V' n; f2 _} 程序②——向量化 change_vec <- function(vec){
+ a. o N d1 a( t" {prob <- c("DD" = "joker", "C" = "ace"...)- {, Q; o/ m% _7 ~
unname(prob[vec])3 i6 B" d" e- v& x0 U4 Q
} 0 B3 l; [# @3 z/ I+ T7 t
方法二:逻辑值取子集目的:一次性完成对一类情况中的所有元素的操作
4 `- D4 a, _5 P7 r; f) @案例:8 e9 j. U' \3 C
程序①——未经向量化 abs_loop <- function(vec){
( y! [( S5 D. _* Y! ?& tfor(i in 1:length(vec)){
" [6 g4 ?% u3 G* X1 ]. cif(vec < 0){
* k; h) ^8 [$ K3 S hvec <- -vec
1 U4 a6 e$ A4 o! ?# Z9 b4 c}
% o3 c" c2 Z) U; d}9 t, C0 j2 }1 z2 J
vec
- p, H2 q$ U! @, s- I, g6 W# L5 j- u} 程序②——向量化 abs_set <- function(vec){, m* q& I% d% ?0 N
negs <- vec < 0! I9 R. `" @; B6 N' D0 M q2 a6 H
vec[negs] <- vec[negs] * -1
! v5 L w: C1 A( {% Y5 avec) |& t' H! H% M. k
} 未向量化的程序:, F1 ]' ]' n6 }5 i, h2 V0 f# S
if 语句一次只能针对一个元素进行判断,来判断出 vec 中为负数的元素( k5 M) x$ [1 I( f% ?0 F; p
向量化的程序:9 c4 X# P* o+ t; G
其中, vec < 0 为逻辑测试,返回一个包含 TRUE, FALSE 逻辑值的向量 negs, 通过逻辑值取子集的方法,得到 vec 中为负数的元素, 即 vec[negs]. 如何在 R 中编写出快速的 for 循环原则:- 能放在循环外的代码,就一定不要放在循环内
- 确保用来储存循环输出结果的对象必须具备足够的容量,以容纳循环的结果* y6 I/ o _' U) v ?
范例:一个循环 1000000 次并赋值的 for 循环在 for 循环之前,定义好一个含有 1000000 个 NA 值的向量.% V$ t; y, J) i0 Q9 S5 i
在 for 循环之中, 对于对一个向量中的元素进行相应的操作.
* p \, L: @( b7 A
4 K; ~5 ~0 J+ v
0 @ n( x/ c1 ?/ U& o/ y |