数学建模社区-数学中国
标题:
拼多多面试问了数据库基础知识,今天分享出来
[打印本页]
作者:
杨利霞
时间:
2020-4-28 15:19
标题:
拼多多面试问了数据库基础知识,今天分享出来
拼多多面试问了数据库基础知识,今天分享出来
, ~0 g8 W( a! a7 c$ q' M
: R% m$ ]9 {7 }( G( J( Q$ ^
前言
; [' S9 G5 Z# t' Y
- T1 }! j" m: V1 V
我是个标题党,所有文章的名字只是我的噱头,我们应该有一颗谦逊的心,所以希望大家怀着空杯心态好好学,一起进步。
5 H1 m x( b- }- t5 L3 Q/ C. U% f
0 Y6 v8 [) B+ t) b, M a# b8 C
数据库我想大家应该一点都不陌生吧,我想不管你写啥的,数据库就算没用过也听过了,是我们项目体系里面不可或缺的一环。
, E9 G! n- ?6 l% i/ t! N- u
1 n5 d. U2 X5 g2 T! ^$ Z$ @
问了一圈,身边朋友公司要么用自研,要么就清一色的MySQL,所以想看Oracle的朋友可能要失望了,但是不影响你了解数据库的通用知识。
8 E; \4 l/ I+ E, X! ^0 V
' C7 i$ Z4 `- e7 f, r( }7 ~- E
正文
5 j7 D( I% Z% i! Q& n
. `" E {3 C7 }) C* X8 _6 F! `
你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?
' o' E2 e! A4 S2 `" l, f
2020-4-28 15:17 上传
下载附件
(48.19 KB)
6 k: S' M! J, F/ f& P
好的那我们按照顺序了解下,连接器是啥?
. i: w* p. O- b
我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。
+ a9 _* ` n/ T
" I! m1 q1 [" s5 r: M% X1 P
他负责跟客户端建立链接、获取权限、维持和管理连接。
/ ^' a9 A( K& J4 S& J% K3 {
" v: ^1 A7 N k$ \' P3 u
链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。
2 X# ^! @$ P/ {3 \2 M1 v, v K+ {
* C3 a. |$ D2 I1 w
验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。
2 Y& }$ S# f G, Y# Q
* ?7 ?9 }- X v
怎么查看空闲连接列表?
7 }: ^/ M. S% O9 A, V% Z7 a9 H
show processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。
' A/ m8 \$ [/ g5 r7 j
2020-4-28 15:18 上传
下载附件
(56.41 KB)
/ u# O( r, T3 m- l
这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。
& i/ {/ [& k; y5 _ b! \2 E
+ b6 R! I6 M) L, z" _
断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。
9 C$ i' \' c) e1 g r% g' |! E
& K, a7 F* S3 T" V8 F5 f6 k
这个有个我看过的书本的案例:
: X4 z. B( X2 x. a
7 Z8 d0 H8 R/ W" w: x4 [/ z- |; {
一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。
# n! D! j5 s/ W6 g4 B8 h/ p7 J) o% M
我分析说,按照这个错误提示,应该就是连接时间过长了,断开了连接。数据库默认的超时时间是8小时,而你们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。
$ |+ K! C' Y2 g, Q' a! s/ k5 w
是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。
3 |+ x* {1 }7 K5 C
. |7 k0 X7 ]9 q- Z+ \
把超时时间改得长一点,问题就解决了。
' A3 X$ J) K8 T, r+ |, `4 ?5 K( P: A7 R
! g$ k6 T6 C, q' D+ ]
这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。
+ |' M4 l- O; w5 k
; ?" _# u7 v9 S
那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。
6 h: m, d% H+ }/ ^9 ~
使用长连接。
7 W' |/ N9 u. ^8 B ^( Z. t
9 L3 g: b4 F" j7 P7 T$ [
但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。
, v' j9 B& g- ?) g* T+ M* c, _
5 ^8 Z8 t4 c0 i1 Z: ~; Y
只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。
& l9 B1 a% B8 ?5 v
7 B5 I2 q. K( p' ? F+ z" A- C
那你会怎么解决?
7 N. Y6 a$ P1 e$ R( H% Y
我一般会定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。
' c, q/ O5 k) d- {1 g* s, N1 R p
8 p7 C$ R* N! y, x
还有别的方法么?你这种感觉不优雅呀小老弟。
! A* g5 y- o+ X: Y' _( o
执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。
6 T" U8 B! i# a+ V1 g
; D0 p! f; U1 V1 g4 D
你了解MySQL的查询缓存么?
2 c8 ]* i5 b* \ Q. j' b& L
MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。
p8 Y R8 a4 B4 C7 \( B C+ h$ j; B
8 U' _7 _' C2 [- }
大家是不是好奇同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。
% W- `6 p1 G1 Z* t& B" V0 W
* Q. R: l$ h' N' s1 _
他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。
; }) E! T+ t* J2 A: ?5 ^2 x
3 r* `6 z! C- y, [ n0 J! j
查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。
; c) |& T' _' _/ B. K
8 S! A5 Y; ^% n j2 m9 z) I
但是我还是不喜欢用缓存,因为缓存弊大于利。
% Y) i: B8 X8 h0 M7 R
7 _; R2 l, c _+ {
哦?此话怎讲?
/ P: }4 r- b; @* I! j5 ~3 u3 J
缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。
# {% f4 o3 {! f. S- _5 c
- a* u- Q! q4 s) p3 i' T
这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。
9 O+ ?7 i( i6 v$ u2 w
' k' ?8 V p, p7 w+ Q; G
那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?
3 V& d) |9 M& I- P
可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。
( l$ l) G7 {5 ^. H2 N
) y4 N1 ], V o6 G. Y1 T. r* X
有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。
% W$ w% i f- s) F Q2 T$ t' Q+ T0 B
! Q y' B4 n9 c' i- [& ~
select SQL_NO_CACHE * from B
' b6 W! X9 e* ?9 Q# B' z, P: ]
缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍,就想起来给大家也提一下了。
: v4 V* Q9 P7 W7 U( P$ u6 G! e
) I8 e! e+ f% A6 G; V% y4 d- }5 {0 L
缓存查询完了应该做啥呢?
$ ]2 W- p- a7 \% ^# v7 T
在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。
2 w$ r; v4 U J' ?, Y
0 r F' R% W1 [' ^* p
那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。
; n1 P# K+ e( G7 }
! j+ `6 G. g6 I; V' g( k; Q0 c- z
然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。
6 R- i! ], c A1 h: N
2020-4-28 15:19 上传
下载附件
(28.19 KB)
) M9 ` _' v7 h% C0 E
分析没错之后就进入下一步,优化器。
4 }0 X; ^" d; |2 t" M! V q1 w& u
: M5 e+ ]! K: z, x% b" l3 [' b6 V
主要是优化什么呢?
2 K3 a; R: h; w" p5 j: T. q- j
优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。
. e* L# u9 y% l
2 F, l; e r a
还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。
$ W _% w, j9 s
$ B5 }$ g6 p) w8 t8 U
最后就是执行了,执行就交给执行器去做。
8 X: B. ^) ~- A
, [$ E0 E3 U# U! j+ {0 h
第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。
% Q( T3 X3 j o) T0 G
! {: L, P6 V, m- ?6 U# m
有知道的小伙伴也可以在公众号【三太子敖丙】去加我微信跟我说。
) B1 _7 D+ ?* K7 V$ [. i+ B7 e
g( K3 [( T, ~' G9 l* P
执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。
5 m% l( ~4 ~' M
: q4 d9 v- v/ b+ x* E2 o$ E; {& |
数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。
7 P% K( Z3 z0 f5 D8 Y$ C! ?) Y$ T
% M( e4 L) Q: @$ X- s; P0 s- E
可以小伙子,基础大致框架还是了解得很清楚的,我们下次深入了解下,索引和部分机制。
5 D: ~/ k6 k3 o
好的,我们下次见。
9 x6 ^+ D; s7 N( Z$ A% _ h
) `( \- i" m2 d1 J
总结
6 r% C' f+ y: a& ?1 ^
. }( l5 N0 p7 f8 Q& v
基本上我把MySQL的逻辑架构的东西都简单聊了一遍,当然你去自信了解的话,你会发现其实里面还有很多细节的,我只是说了一些常见的问题,这还是阿里丁奇学长的《MySQL实战》的思路。
/ W4 ^, f; z f C2 K$ G
% Q7 J( Z! p* B) ^# K7 ]' j
我自己在MySQL方面更多的可能就是理论知识了,还做不到深入了解的地步,大家如果有机会一定要深入的去学习一下。
2 O5 H/ G3 o1 \6 T7 E' r* A, g
————————————————
6 {* g& M2 Z3 v% l7 H; Z
版权声明:本文为CSDN博主「敖 丙」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。
& L7 S( E4 r; L: Z5 t C! b1 _' h1 i+ t
原文链接:https://blog.csdn.net/qq_35190492/article/details/104203466
( ]$ F* D2 t# m7 ]5 Q; W
- j7 `& a/ d2 H! [6 U+ V
, G- l4 m- k' p4 g( P& u
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5