/ ~: D' ^5 Z% N2 S
4. 创建随机数组 + S. q+ M# y4 o7 U$ ~3 a9 s% n 4 I m% |; R0 Y* R) t- k) I% Xnp.random 模块生成随机数组,更加方便,示例代码如下: + f2 o. ~4 \9 V- D z* K& q& ]5 f7 W9 ]$ v
上面产生的数据是属于一个均匀分布。那么什么是均匀分布呢?在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。 4 P8 ?9 m- j! E! X% C9 C; N- O* G: K
正态分布?给定均值/标准差/维度的正态分布,示例代码如下: 4 K1 K6 Y; x* J' m$ ?: s " a( m3 E$ H& Y0 ~8 J正态分布是一种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ是此随机变量的方差,所以正态分布记作N(μ,σ )。 ( ]. h6 s; v2 H# E( R, d% E. t; O7 \
生活、生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。μ决定了其位置,其标准差σ。决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。0 C" }# Z, v* @1 J6 R, T9 F/ D8 ^0 N
1 W' j* q" c/ ?5 G* M
标准差如何来?方差是在概率论和统计方差衡量一组数据时离散程度的度量。 6 k: {2 x- c) J9 ]3 {# E2 q1 K5 N' e( R
其中M为平均值,n为数据总个数,s为标准差,s^2可以理解一个整体为方差。9 h1 G: O1 Z0 a% Q4 Y( [
7 K6 g9 Z/ a V8 ^: h9 j通过索引切片等获取数组中的值,一维数组示例代码如下:& K) F9 Z' f5 H6 U \
, p8 W/ p! g4 U2 ?; Y9 w( G8 N
二维数组示例代码如下: * H+ r# r- e/ g5 M$ u$ q) s* E f* R1 v# @' z1 }6 @
三维数组示例代码如下:4 ]+ z" U3 n- z, {' m/ x6 G# m/ A
5 L$ |8 \7 U8 V1 V" y K
5 ?3 I6 r: O+ L! w
4. 数组形状与类型变化: a- X6 E6 h3 y: f# y
1 ^& Z: f& z& c% y8 _" c1. ndarray.reshape(shape[, order]) Returns an array containing the same data with a new shape. 示例代码如下: " r2 l/ W! j7 h1 ~, T, Q* G+ R L
2. ndarray.resize(new_shape[, refcheck]) Change shape and size of array in-place. 示例代码如下:+ {! M. l1 r4 W U4 c( a6 H7 N) b
4 m$ N( c1 e v d; }9 {9 ]8 H* g3 ~3. 修改类型 ndarray.astype(type) 示例代码如下:* _3 @7 F0 }, J- I
& }; Q( W ?# ^7 d! X6 [& Z4. 修改小数位数 ndarray.round(arr, out) Return a with each element rounded to the given number of decimals. 示例代码如下: : ~% T/ v- e B1 M: b" z 5 E( A# ]7 Y$ t7 E5. ndarray.flatten([order]) Return a copy of the array collapsed into one dimension. 示例代码如下: ' {% Z$ f9 @5 t4 v3 K1 y0 x0 o; k * O1 P, _1 P) m, H6. ndarray.T 数组的转置 将数组的行、列进行互换 示例代码如下:2 H6 F* N$ O4 G k2 x
0 @/ B4 k# W3 w$ _, r7. ndarray.tostring([order])或者ndarray.tobytes([order]) Construct Python bytes containing the raw data bytes in the array. 转换成bytes ' e2 a; B8 g& D9 x, z+ \- N8 n8 V t" {# p& E+ _
8. ndarray.copy([order]) Return a copy of the array. 当我们不想修改某个数据的时候,就可以去进行拷贝操作。在拷贝的数据上进行操作,示例代码如下:4 K! B- m5 R' u1 M" i
! H, Y) ]) z: \8 [0 s4 M9 C9 S( l & g% k0 F& g' A+ H. t5 t7 Y4. 数组运算; r |- H9 w" i1 I% f
, V: ^' W7 Y# J3 Q+ f
4.1 逻辑运算" q. w8 O8 `# K( ?2 {- y. W( O. _
' w5 w' ]. d8 F
; X7 @' Z2 ]- e0 D( l通用判断函数,np.all(),示例代码如下:8 f7 {" ]+ ~5 n0 }0 U6 E
4 H4 H! B d2 C2 i1 u
np.unique():返回新的数组的数值,不存在重复的值,示例代码如下:- I. E" N6 U& \ @4 Y
5 ~4 \# w! H5 p9 lnp.where (三元运算符):通过使用np.where能够进行更加复杂的运算,示例代码如下:9 P- W! d) P5 Y
7 N' `; i2 @0 N
* h5 U' }) e: Z9 t
4.2 统计运算 - l( Z" O( v Q- q3 ] + Z9 D$ E& ]1 g3 }$ A1 r4 n在数据挖掘/机器学习领域,统计指标的值也是我们分析问题的一种方式。注意:进行统计的时候,axis轴 的取值并不一定, NumPy中不同的API轴的值都不一样,在这里,axis 0代表列, axis 1代表行 去进行统计。常用的指标如下:0 O) L6 l( T' O! N/ z9 D$ e' u
, O9 {6 l# b; z3 `' A; W4 Qmin(a[, axis, out, keepdims]) Return the minimum of an array or minimum along an axis. 示例代码如下: ) C& H8 s1 `& [" }8 C7 W |! ], K' q2 [/ U* b
max(a[, axis, out, keepdims]) Return the maximum of an array or maximum along an axis. 示例代码如下: ! z4 h. A& |7 x) U$ U% G4 S5 @7 C ?. q1 G G3 r
median(a[, axis, out, overwrite_input, keepdims]) Compute the median along the specified axis. 示例代码如下:; i4 |& Z' n7 z1 D8 x# f# z
2 o" j& N, w- @. E+ x3 o1 J r9 e" R
mean(a[, axis, dtype, out, keepdims]) Compute the arithmetic mean along the specified axis. 示例代码如下: 9 _$ s+ `: k0 b/ j- Q / |$ Q I, [1 W- Ostd(a[, axis, dtype, out, ddof, keepdims]) Compute the standard deviation along the specified axis. 示例代码如下: 5 d) m9 t7 K( U9 c$ |. a3 p+ f7 t/ v/ t- ~
var(a[, axis, dtype, out, ddof, keepdims]) Compute the variance along the specified axis. 示例代码如下:3 e( T7 t6 s$ @! B, R* [! x# p1 f