- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 560041 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 173385
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
拼多多面试问了数据库基础知识,今天分享出来4 t3 @& K# l' P9 Z3 t$ \0 K
- F0 P+ {4 s5 @) _
前言! J( j) a+ A6 h# C
! a6 q8 l: @. }+ M
我是个标题党,所有文章的名字只是我的噱头,我们应该有一颗谦逊的心,所以希望大家怀着空杯心态好好学,一起进步。6 |, y/ V2 r# i: ?) o* p1 x9 ~
1 L( m. g5 A4 S3 r( {+ p: O! m数据库我想大家应该一点都不陌生吧,我想不管你写啥的,数据库就算没用过也听过了,是我们项目体系里面不可或缺的一环。
$ m" D6 J& I. X, ]" L' A# L s& K! e5 a8 A+ f9 ], @1 [9 R, V
问了一圈,身边朋友公司要么用自研,要么就清一色的MySQL,所以想看Oracle的朋友可能要失望了,但是不影响你了解数据库的通用知识。7 D) F1 K; H; ^# ~
, o) n: @/ @5 q: V* b4 y正文
3 f0 m: h |4 J" a: l, S
, `/ j5 B c0 }/ J0 b" E1 R你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?
$ E2 Y' x& M. [( }; u, @! O, _
2 E& e: z7 X: C' u' ]2 j
好的那我们按照顺序了解下,连接器是啥?
- Z1 n; E: I) F- G3 i. }我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。
. g- Q0 G7 q7 o- Y* H: a+ `3 K' [
) y/ u9 D7 ~) m他负责跟客户端建立链接、获取权限、维持和管理连接。8 j0 ^. J% G4 H: n
, S# x; N4 v/ t链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。) o, S" r! E) T9 p4 p
7 g$ U) C* M' o! F5 I, Q \: r验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。
$ G' F' T5 O3 {0 Z, G. \1 z$ c* x# T- i- [0 w) x0 D! z
怎么查看空闲连接列表?0 l0 I n0 x1 _ F! ^& @: i- N
show processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。
' X. o7 _5 n# s7 O; q
- D- ?" H2 `/ S+ V1 \- \这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。
: E( C0 U) ]8 r8 W/ [* p. |3 P" v
E! `+ g# w% B- V: S断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。( Y K. S9 @, m6 I E7 p5 n( `& X) H' \
# w$ w) R+ p; D9 |% _ ^
这个有个我看过的书本的案例:; H0 i* M1 O, W% \) r: P: |
' Q) m: o% e- i/ A7 P
一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。1 Y) L0 k8 W6 b* v
我分析说,按照这个错误提示,应该就是连接时间过长了,断开了连接。数据库默认的超时时间是8小时,而你们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。- E% T) X3 M* J6 Z* Z7 e
是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。
. x3 Q2 J) @7 O
. R j4 K3 d$ p5 _把超时时间改得长一点,问题就解决了。9 R6 O. i) P/ W: V
& i& l: x; ]$ z7 ^, K' Q# q7 `这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。2 F7 y- R" t0 O! i8 J, Q; L8 o; Q
8 i9 o |3 I6 p% E$ I `那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。- `7 C# G! o5 i
使用长连接。# q8 z7 y* c: ?: g3 d7 `
2 {; C/ X. E' S* s& r: j
但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。
6 l9 s. B* m: C5 t* V; a4 ^( g2 o5 j$ X8 E3 U3 N) y
只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。
5 g: e, E% @/ \
+ b" @1 `4 J9 k9 p2 ]6 J) ? A! ]那你会怎么解决?
: Q. q6 ]6 B6 x我一般会定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。
8 A$ C/ B0 S* X# u% z, C
: j/ Y1 C; G N还有别的方法么?你这种感觉不优雅呀小老弟。
) K7 {3 H! I9 {' X执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。: m/ R! _8 E; H9 u5 ?# H
( R4 ]0 R: D1 L1 n7 K& }9 E
你了解MySQL的查询缓存么?
0 B4 ?9 D6 o/ L: V8 ?6 B8 e+ e4 \# v' eMySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。
& v9 T2 e( U7 ^" ?- p+ y& t8 w+ ]2 H3 [5 s8 |4 L' z* d
大家是不是好奇同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。/ a) ]* d: X6 w+ n3 [& d
1 {1 P5 s& Z9 V
他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。" I* d9 V4 f/ d$ r7 M: P
% V, G5 P7 U" K) ^4 T查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。
, s8 [. F5 ]' y ^: U9 s Z# L9 V- D' w
$ z( p% Y( u; a h) j但是我还是不喜欢用缓存,因为缓存弊大于利。 ^$ t9 c% H% W2 \. s3 \
# T M6 v7 l' N; T; ^* f- U哦?此话怎讲?# Z# A: K. y5 J% o7 t5 ]* E
缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。
9 U9 o4 U- u8 a( O. `- l! _( M5 r2 V
这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。7 ^; E7 ^& R, K+ X' L; j& K% C3 i
* q$ z5 Y) m! t2 R& E( }那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?( v/ @; x! B5 d3 l/ p4 @1 P7 u7 s
可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。4 d4 l5 U3 {7 G2 X+ R
8 Z7 v( V, R, r/ s有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。
# f3 T% r* Z( c: A4 F) n
# b* j7 \" @# I7 \; f select SQL_NO_CACHE * from B8 h/ l, F: d8 Z# { V/ D
缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍,就想起来给大家也提一下了。
; A2 U9 G0 \5 k/ p5 `8 T* g0 @- a4 u/ z" G' a/ H$ l5 p
缓存查询完了应该做啥呢?( |+ u" j' }0 A% P t4 @! R
在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。 p5 C @. g. }) A5 M6 g O
8 R8 \, _1 Z2 g1 r: Q那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。+ P5 c. T$ Y2 C0 O
# X6 I, D# k1 S) I' w/ ? h
然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。# f& f" j6 [+ @* a& ?
& @$ S. o0 A- b0 p3 K$ P4 T分析没错之后就进入下一步,优化器。% a5 ]( B. o* s/ R
' [0 Q! {8 X) S( x9 y主要是优化什么呢?
; ]8 ~, d7 K( v" ?6 Z7 _优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。+ T! ^; k; ~( J- V" [! I
1 U! s7 Y5 `: @; T! M( ~还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。) }8 X% ?# z$ b3 V0 N
r8 J% S1 H4 a, ~3 K最后就是执行了,执行就交给执行器去做。
: w% e6 l1 E; y9 W
# V% |8 G( C* b' x( P. t第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。
, g+ H3 s# m3 a( }0 g: N2 u* Z( W6 W D4 S
有知道的小伙伴也可以在公众号【三太子敖丙】去加我微信跟我说。
& ~9 h' V n: Q9 q7 f+ B
0 e7 G- U; k. C" R/ ], E% @执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。
+ R7 f# c# F2 l1 Q" J+ C z5 _" @
数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。( k" F6 a" b0 e/ g( W2 b. h- ~
% \. Z. F9 H" S; J4 h5 o可以小伙子,基础大致框架还是了解得很清楚的,我们下次深入了解下,索引和部分机制。
^8 I: L- M& K$ W好的,我们下次见。: V: i# C$ G' J/ Q
: h9 k" G, C. v! a4 p0 b
总结, m4 \! u6 O6 k( c4 P( x+ T" O% g+ y
6 o# a. |- H- R0 }
基本上我把MySQL的逻辑架构的东西都简单聊了一遍,当然你去自信了解的话,你会发现其实里面还有很多细节的,我只是说了一些常见的问题,这还是阿里丁奇学长的《MySQL实战》的思路。& m3 D- |5 N9 Y
6 ~( H! [+ q- j6 s- U. O6 F我自己在MySQL方面更多的可能就是理论知识了,还做不到深入了解的地步,大家如果有机会一定要深入的去学习一下。
- o [/ K; d% _$ \" j [, G, e————————————————# a Q2 F9 W* Y; U# L7 _6 K. ~* v
版权声明:本文为CSDN博主「敖 丙」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。
9 C" D8 {8 r/ w* O原文链接:https://blog.csdn.net/qq_35190492/article/details/104203466* U b; v- R) h2 a ?! c
& h& D4 [+ h" N4 F- f x7 u: l
" v/ Z: g4 ]& K |
zan
|