数学建模社区-数学中国

标题: 拼多多面试问了数据库基础知识,今天分享出来 [打印本页]

作者: 杨利霞    时间: 2020-4-28 15:19
标题: 拼多多面试问了数据库基础知识,今天分享出来
拼多多面试问了数据库基础知识,今天分享出来
1 t6 w) r- [- q5 p) e( V. W1 u9 l4 [4 e7 c. N1 \
前言
! ?  a/ a- K6 m
8 q* w# j! Q2 X: L我是个标题党,所有文章的名字只是我的噱头,我们应该有一颗谦逊的心,所以希望大家怀着空杯心态好好学,一起进步。. T2 u% p! B1 _6 \
, o: @0 s* \- e% v
数据库我想大家应该一点都不陌生吧,我想不管你写啥的,数据库就算没用过也听过了,是我们项目体系里面不可或缺的一环。) ]& d' a* U% w& g

5 {( f- q, G5 b4 Z( l问了一圈,身边朋友公司要么用自研,要么就清一色的MySQL,所以想看Oracle的朋友可能要失望了,但是不影响你了解数据库的通用知识。
* _. ?) `2 W+ E/ T$ n! m: X+ c3 L
: G% s% [( \  M; Z% j正文
, l; P3 r$ Y% P) g/ w
( d- U( U: @( R7 d你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?
- U- r9 X& r) W3 v. U7 w6 O 1.jpg 9 w3 }" r$ N/ u, r- j3 j
好的那我们按照顺序了解下,连接器是啥?
: }. C/ B3 i. {; Y4 t我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。* @6 o1 B3 D: N( c
% r# r  U8 b4 V" [
他负责跟客户端建立链接、获取权限、维持和管理连接。
1 L" V9 ~7 n& _! i2 }2 w
; K) {4 `$ V2 B, m8 N5 e链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。1 ?& m6 r$ G% A1 z9 d/ U, k
# I8 O5 a3 _/ {% s2 |5 M+ U
验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。8 j" t7 m: B5 W7 ]+ A: J0 U

7 e5 l' S0 r; j: n& ^+ P怎么查看空闲连接列表?% i& b& }% U, {8 W  I) v
show processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。
" l1 O. y4 L" G 2.jpg 7 j* j" y- H! Z
这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。3 e( Q; t' k9 J" c- Z# Y/ L

; Z/ e! ?  ~, k) ]& G/ x2 y断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。5 D' m# z7 A! |- j

* O9 s$ ]* q8 W* X0 M1 n# e6 o- W这个有个我看过的书本的案例:
2 I: m0 I( D! W# _! Z2 H% y# q7 x# K1 ~. R
一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。
  o/ M9 I+ l  S& @我分析说,按照这个错误提示,应该就是连接时间过长了,断开了连接。数据库默认的超时时间是8小时,而你们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。
1 B+ a' [1 R: i; P是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。
$ E' k1 c0 ^' Z8 K2 b
# q6 C% z6 E2 q把超时时间改得长一点,问题就解决了。
& S" l* r& A( O) E. W
/ ]5 g/ m$ l9 o( O$ k这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。
8 }' E- ^) a4 z1 F1 H
  |, T) l' Y4 J% t, q, M2 O& F那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。( e; L- r6 w& ]4 w( n
使用长连接。0 L, Q5 F  d; v% Q

# {5 e! l0 N5 o$ ^3 t但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。
/ _  w8 |, Q* O' F: W( p0 U" F! G, F/ n5 F5 X" h
只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。9 }0 l: A9 u+ T- [& F: `, J

" H( V# H& M$ }# ^6 I那你会怎么解决?
0 M% S- S7 ^6 j1 k我一般会定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。. A* \3 ~. j( k7 E8 Z# X$ J! w
) i* M) \1 {6 Z; ]
还有别的方法么?你这种感觉不优雅呀小老弟。4 l; [) j/ U! x
执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。5 _  d  ]  m2 x% {9 H1 G
0 e! ~% |+ S9 @- H: F
你了解MySQL的查询缓存么?1 c0 _7 F% R0 J5 g5 l1 h
MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。" }2 u' ?  B' L

3 x5 t: \- \: M8 ~2 u大家是不是好奇同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。
9 l! R# Z- L  Q
, \- s0 N8 v: e他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。& }* D/ |8 R" T% q2 y+ T

* v( B. A( F* U. B1 o9 r查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。# r! j. I7 M6 m$ c* _+ Z; d* ]
+ C$ M4 b: ?8 W- _: w$ F
但是我还是不喜欢用缓存,因为缓存弊大于利。6 o9 y$ T+ m1 U; E3 U

! x* j8 A. M$ h, t$ J. E) I1 f哦?此话怎讲?
- O* A: U+ X! {6 Z3 _缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。
6 ^9 ]7 C: G* s+ z
, @3 R% a8 D- l这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。% p4 Z; p! c6 {# M" E2 g' S

! |1 n! b! {  ~$ \" N6 \那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?
5 a" b$ f% `3 t9 [可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。
' F  v( J/ w$ h# M/ F# }  H' r: W9 Y9 ]
有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。
7 b- }$ V3 o$ k0 D
' n. `- V# y4 v, h. S select SQL_NO_CACHE * from B
# v  L3 z: D2 f/ y7 E: }& i缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍,就想起来给大家也提一下了。! e4 F" o" i/ \2 c
1 Y4 k' y/ k8 O
缓存查询完了应该做啥呢?
8 @3 K9 H" V% ~) S3 p+ {/ L3 y在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。0 ]( L! l' D1 X9 i$ d0 n
3 }7 s7 [9 N- R6 l0 g* C3 {) c) K7 C" s
那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。
- Z; D7 @) X. M5 m' S' E
0 P9 t* r- n4 @, J1 I( Q& b然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。2 Q2 ~8 \: W+ `2 V' P
3.jpg   `1 V% y, N* {" i, A1 y
分析没错之后就进入下一步,优化器。, |, J( Z7 i; i

$ g0 w- W* n  F3 o. D2 k% g- r主要是优化什么呢?
4 @4 L$ x8 V# b; C! F2 v优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。
5 Y  X4 G* G! b7 R* q* A
9 y: H& o$ b( }5 c! |5 W; U还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。
7 ^9 @! v! ]- J& p! g  N5 ~5 b# b; _' k$ ^* U  Q4 N
最后就是执行了,执行就交给执行器去做。
2 d% j0 @5 t$ o- U( A$ r) v+ I
( N4 q6 X9 F8 {- b( i: N* t第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。
$ Y) Y& H: ?  {9 m' }* n7 `, ?
5 ^1 r$ H% Q1 `有知道的小伙伴也可以在公众号【三太子敖丙】去加我微信跟我说。+ d  E& z! @( S! Z( l

" m- m. _0 b4 N9 p执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。4 V9 F2 Z9 j; f: v& t& R' N3 f) j# k
; o7 R$ I6 m/ j6 |
数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。5 V3 R* P! e7 h' I$ l2 |

9 l" s& L4 ?# ~: v+ |# ^可以小伙子,基础大致框架还是了解得很清楚的,我们下次深入了解下,索引和部分机制。
1 P. x5 y& C2 p好的,我们下次见。4 {0 c) a2 y! s9 r# z/ V( ?, x
' U8 o! i) n, D
总结
6 K, N3 M( @# w
; F) E1 `5 R% y4 _6 `基本上我把MySQL的逻辑架构的东西都简单聊了一遍,当然你去自信了解的话,你会发现其实里面还有很多细节的,我只是说了一些常见的问题,这还是阿里丁奇学长的《MySQL实战》的思路。5 A: M+ k! {! N5 f+ W+ y) K  [

( j7 S# \- X7 z5 R5 P* W+ C我自己在MySQL方面更多的可能就是理论知识了,还做不到深入了解的地步,大家如果有机会一定要深入的去学习一下。. a$ p% w( f& F' U; d- ~- S
————————————————5 k, z& o" f1 L1 F& a. B, S
版权声明:本文为CSDN博主「敖 丙」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。( s4 k4 G+ e2 Z9 C/ e
原文链接:https://blog.csdn.net/qq_35190492/article/details/104203466
. A% n6 n* g9 ~& O! F  H$ i4 e$ L1 {, ^5 j  e% }' I

3 V2 K7 X2 M/ r9 ~0 c5 ?: M- ^1 U




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5