数学建模社区-数学中国

标题: 拼多多面试问了数据库基础知识,今天分享出来 [打印本页]

作者: 杨利霞    时间: 2020-4-28 15:19
标题: 拼多多面试问了数据库基础知识,今天分享出来
拼多多面试问了数据库基础知识,今天分享出来; \4 y: a- q$ C3 f' K1 N

" z% [( Q! e+ o2 b+ q" r前言3 Y8 E9 x8 j5 o3 P
- k  {3 B0 F. N6 m1 q% |/ [
我是个标题党,所有文章的名字只是我的噱头,我们应该有一颗谦逊的心,所以希望大家怀着空杯心态好好学,一起进步。  S3 a' V$ w- u/ r2 p: q, c8 M

8 K! p, J$ L7 o6 z. P; M数据库我想大家应该一点都不陌生吧,我想不管你写啥的,数据库就算没用过也听过了,是我们项目体系里面不可或缺的一环。; [" ?* h+ o$ Y) g! V9 M) W; ^

# S$ e. w3 U  t4 g问了一圈,身边朋友公司要么用自研,要么就清一色的MySQL,所以想看Oracle的朋友可能要失望了,但是不影响你了解数据库的通用知识。
  E* @  |# W* w
6 ^& w2 u( G2 _# A) y  h" L. R正文1 g% z" U" R7 I

8 d1 J9 d0 z: r3 [9 s" M3 m" f6 T你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?" A( g5 n4 M1 u4 f# \; D$ J
1.jpg ' q( x  f& ?3 |; C, D7 T5 f
好的那我们按照顺序了解下,连接器是啥?
7 M! @$ ^' c9 N" Z/ B. g我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。
0 S+ o( B9 C4 k- `* b0 O/ B8 [
. t* a, w/ F% H; P3 w他负责跟客户端建立链接、获取权限、维持和管理连接。1 D8 a' g/ `/ B7 x

5 s9 N6 Y9 K+ ], B; N4 b+ S链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。! }% ?0 n1 `- [/ e, [; J  w( e9 z
/ X, T$ V0 D% p/ I3 i( h/ L  T) f
验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。* P. \; N& f* ?) S  a

. r3 z& P2 t) G+ y/ L怎么查看空闲连接列表?
" U! q/ ?0 e; _8 C% V% Cshow processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。9 o9 \* h0 Y9 M( D: i
2.jpg 2 e! V2 C3 C' z7 \2 B7 S
这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。
- t7 N2 |3 Y. c: p% D! n
7 m) k) Q* L( v4 u7 O2 ^断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。
4 C7 x8 J5 G6 K3 M, e
0 T- V4 S' ?5 ]8 l# _这个有个我看过的书本的案例:5 S) v8 N5 ^) s8 y
- y  r" p- O, j6 F
一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。- r: j3 A# B) u0 W
我分析说,按照这个错误提示,应该就是连接时间过长了,断开了连接。数据库默认的超时时间是8小时,而你们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。
2 ?) `- b" S  g5 f是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。% h' ]* |% N+ C2 z8 c, |# |1 y
& q2 B. l9 _) Q: \. v
把超时时间改得长一点,问题就解决了。6 Z+ z5 b  `0 X* j" a8 \4 M

* R: ~; X2 @! O这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。! ^+ a4 G4 J. |1 Z# m; P) M2 G- O
( t; `( l! t8 K7 N8 ?
那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。
8 o+ M% r6 q: r# z7 V使用长连接。
# \2 z; s2 U3 C! D# D; Z/ X
! C$ ^. J& }( o+ p) W/ J- v2 [! @9 I但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。
% \, F9 c2 F+ g& x" Y  {
6 T' |4 n+ Q( k( O, @, }只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。
1 e1 q0 F2 @7 G$ _
4 z& [7 c2 X. Y4 e& z那你会怎么解决?
  q- B9 V, p3 f  T) C我一般会定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。# C( @! m/ y9 w, v: K

& D9 L+ T2 [6 {' _! k还有别的方法么?你这种感觉不优雅呀小老弟。
. F* O6 K- E9 b% f& _- d执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。( l1 W8 V% [, U

/ v) K/ y( T- F, @0 e7 c, L- v7 ]: `你了解MySQL的查询缓存么?, k% T, G- h3 j6 k9 v; ~
MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。6 g$ W/ q8 a( v1 t0 x, |. D

  U. H4 P; \; @, _大家是不是好奇同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。, K/ r* n' n# z2 u2 `2 H! P$ |6 g
$ N; F" p( {2 S8 H* C3 q
他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。$ d- r2 E! T6 n9 U0 @- W& f

) h/ R) D/ @' t' H6 }4 p查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。
3 R4 ^2 J: {( B& k) Z# G2 h. v0 k# R$ ]1 V
但是我还是不喜欢用缓存,因为缓存弊大于利。& ], Y+ W! N3 F  e* O

9 b8 r0 d4 b$ r, z8 O( {哦?此话怎讲?/ ]  N6 M; {* {
缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。: z; a1 C8 p/ u2 K& r" w) g& X+ o
0 t2 }5 G$ W) A6 u& Y! q2 H1 ^
这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。
; Z; ^4 u) `( n' f8 x9 o3 C  k7 \" Z8 W% J# Y4 E
那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?, K; ^; t6 t5 u! l* W) s9 z4 u
可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。
5 }* D: D: ?+ o. t% B" ^
: E4 U) x( K4 @0 h1 r, Q有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。# ~" Q" V% F  t7 G* x7 t6 H

4 `' I5 v( O1 l, M  P' ?4 G select SQL_NO_CACHE * from B2 u% R# ]: i& J; P& m* `
缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍,就想起来给大家也提一下了。+ {2 Q8 N  M4 i6 Z" i

0 }' R% [* ]& P/ z3 M! Q缓存查询完了应该做啥呢?
( r! [! K0 Y- B' `$ Q0 k在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。
) n4 n5 F: o: D1 a( k
' y; |) s# ^) a2 Z那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。  E" D7 V% W7 P5 I% s

: N) }, r9 O/ k: T3 L% R4 E$ V然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。' ]# n2 ?1 ^, Q. S- r. q
3.jpg
8 n! T- h9 p+ h3 H8 k分析没错之后就进入下一步,优化器。
" ^% V% W) p( R5 |9 `( W1 H# _3 M; q
主要是优化什么呢?
% U# ]$ [4 q( z: |3 b1 v优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。( }6 @0 D9 u& n* p4 x- ]1 X
. Z" s: R0 C2 w
还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。) N& U; I$ ~5 X  o; u# q
0 m* B" T- `7 N: A# z8 j0 B
最后就是执行了,执行就交给执行器去做。. E% ^% q4 B- C( o* i

6 P' I) Q- F3 B" A第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。: I5 a! z3 F2 A8 Q
8 ^, }5 d9 [8 l7 ?
有知道的小伙伴也可以在公众号【三太子敖丙】去加我微信跟我说。% m  {$ {$ f# E0 C

  p0 h8 Z( a# h2 w8 i执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。- ~, D* }" E+ Q$ p2 f/ C

/ h4 E& ~/ Z0 s) }: U. H& @7 @6 t数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。
3 u; {+ [+ }- W& G
, a, C* c; c7 P可以小伙子,基础大致框架还是了解得很清楚的,我们下次深入了解下,索引和部分机制。
/ v2 X) P4 s( {好的,我们下次见。9 }' w2 w4 E! {1 [' v* G
2 V/ }2 t5 _) F9 u' s6 {
总结! q4 G- F- c- _  V
2 F! K* M* i: D  t* r1 x. f2 ]
基本上我把MySQL的逻辑架构的东西都简单聊了一遍,当然你去自信了解的话,你会发现其实里面还有很多细节的,我只是说了一些常见的问题,这还是阿里丁奇学长的《MySQL实战》的思路。$ V/ s6 w4 T. I  `, r7 _

  F4 k) ?0 Z( @" t我自己在MySQL方面更多的可能就是理论知识了,还做不到深入了解的地步,大家如果有机会一定要深入的去学习一下。
2 j# e" Y& r; Y8 d  O————————————————+ D" k4 v8 N) G8 h7 c
版权声明:本文为CSDN博主「敖 丙」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。
( e  l3 r, @1 p* C7 i原文链接:https://blog.csdn.net/qq_35190492/article/details/104203466
/ \; o) L: w* T5 {& Y4 x$ w) o. s* m, W* O, j0 T$ i7 Y) _1 k; T
5 l  `3 x0 }0 N" R/ e+ r# G





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5