- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563253 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174199
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
拼多多面试问了数据库基础知识,今天分享出来
/ J) ]( F3 V( {, S U" T
/ i1 F! L3 U/ A- [% ]% V前言( ^- E! Y7 M+ v t
^6 c2 f& I- d& R我是个标题党,所有文章的名字只是我的噱头,我们应该有一颗谦逊的心,所以希望大家怀着空杯心态好好学,一起进步。2 S# y( r% O6 d2 J# T: Z5 Q& M
$ t: i3 {! R( U$ s7 O/ L7 j& J9 }: @
数据库我想大家应该一点都不陌生吧,我想不管你写啥的,数据库就算没用过也听过了,是我们项目体系里面不可或缺的一环。
! y4 I) T$ l$ c# @* p
4 H' \6 k P% h* V4 B问了一圈,身边朋友公司要么用自研,要么就清一色的MySQL,所以想看Oracle的朋友可能要失望了,但是不影响你了解数据库的通用知识。
% P% @& H: W" \5 f% h3 L d0 Z: U
; i! }( q- W ~+ e3 | k* A正文& @0 s, V3 h& w/ O! v
0 }0 q; `9 S9 H, ^2 E你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?
: d$ U" W: Y8 X/ t5 f6 ?
( U7 [( k! W% R" K, I好的那我们按照顺序了解下,连接器是啥?: y* G9 H7 N9 A# f, y4 F) u/ W
我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。( K6 |: b. ]4 y3 R( L/ s! |% V
/ W7 \& F2 L: F* G) U% I他负责跟客户端建立链接、获取权限、维持和管理连接。1 S6 R1 L5 v a0 I
. F5 x! z' c5 z7 g+ J3 b
链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。, t" ]# g* s% a
* t) y5 n) H- F2 L7 b
验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。7 V1 x; |: ?. z5 ]6 I. i4 g/ k9 n# k
( J4 ?! D) |3 V6 f3 `) e! p
怎么查看空闲连接列表?
% a1 \% a7 y. E6 Hshow processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。
* _1 ^/ G/ \3 U
1 y- k7 Y$ i. o l1 `( u3 f这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。
x9 v* u9 z% T( g' W' e& O
" W* s0 D. D7 n/ V, |断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。
, w7 X6 h. _* K7 R" d
5 I( }0 k3 x0 x这个有个我看过的书本的案例:
2 g. A& k5 R9 Q8 P3 y. G
5 l! A+ C1 U- L: u( K一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。
% k# ~# `4 @% S7 u( |. U0 B1 s9 ]我分析说,按照这个错误提示,应该就是连接时间过长了,断开了连接。数据库默认的超时时间是8小时,而你们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。7 B6 P0 |, }! _+ A$ u$ u$ @
是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。
. n+ w& S# O' n$ G1 M" Y- Z0 W- q/ q# X# `% b, H/ [+ C9 `
把超时时间改得长一点,问题就解决了。9 P3 _6 r( ~" o1 V
* l1 t) U9 x( C' o7 h' V$ u
这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。
' F' ?: X; K8 t5 y' I# {6 H" A; y3 \8 }) f# f% k
那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。0 \2 `5 O* E6 t$ {4 Q/ S: d+ f
使用长连接。. G$ v1 \1 F$ x1 S- n
9 n; D; c) n; w: e3 {8 v$ q5 Y3 S' ^
但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。
- H8 _4 j8 J5 U( } w5 x
0 c- f0 m1 N, \# R: I只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。$ }% D& E) ~) a
* D ?1 C2 m" t$ C: W7 C6 |$ m Z
那你会怎么解决?
% t4 k- h2 U2 h/ J! h7 U我一般会定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。; m/ A% L9 o% J v5 K
! N& |0 q6 m/ M: S
还有别的方法么?你这种感觉不优雅呀小老弟。2 b/ u; i( z+ m+ \3 a, V% M
执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。1 `9 U( M8 M( H+ ] ^ v! r& z, K
1 w% W$ j$ d: q! Q
你了解MySQL的查询缓存么?7 R' K. |2 N# o8 f
MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。, D( |0 R% z) n* z& p0 O8 M
, B6 r6 T2 i) Z# x7 }- Y a9 }2 p大家是不是好奇同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。
3 \& f4 p+ E% j* _% J4 U u
1 n1 B5 o* l- t. J他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。 t7 ~) _& S' f% q- C
: O3 A8 X6 B h6 X6 p9 @
查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。
& Q( Y4 Y8 S z; Q' F
+ X; Q; K) e5 S2 M( K9 ~& c但是我还是不喜欢用缓存,因为缓存弊大于利。4 K* _! H$ Y) E) ~
" H8 W, {0 L' i
哦?此话怎讲?5 R, @, _+ K, K
缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。
2 f/ |: f( D2 W* a$ `& }& r \/ b3 y# f% ]
这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。
* [" ~5 ]) u5 Q+ g u
G5 D% c, e q- f1 |那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?2 X% V5 d+ U. c$ V8 w$ c
可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。
; p c1 h2 U8 g' l2 g7 p
$ g1 Z# q3 J; i/ l8 O1 P有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。
& n: g2 e7 d3 J3 Y" C i
0 `% J4 k1 \5 f select SQL_NO_CACHE * from B! w; B ?/ Y+ F: K0 @2 n, _% a
缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍,就想起来给大家也提一下了。
( [2 A" S" q) ?* R4 }) }
" P2 V4 f5 ^8 k6 x: {2 Y缓存查询完了应该做啥呢?5 Z- \2 c3 o# A2 ^' ~% D i
在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。
& l7 [+ Q# c- {' {( B, F! f) N) N8 d- R: ^; v- h) h
那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。
: i& T9 v3 ?6 A5 M- ?2 F
! L ]$ U( B5 e然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。
9 f$ n; h( l# g% Y* }
: y$ A, w* f+ B! j
分析没错之后就进入下一步,优化器。
9 d. ^' I/ T2 d! N5 h" f' A- }6 D8 T' C: t$ e2 S/ ?
主要是优化什么呢?
0 n5 J7 i5 j/ I0 P1 ]2 T优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。
. D6 X r) x s7 R
/ w! P9 x& c; L还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。
6 U8 `4 c* `& y0 X9 a h' z( I! Z; g0 u% |- Q5 y
最后就是执行了,执行就交给执行器去做。
: R# X ?( q$ z8 h0 L( F# C. z; R- Y2 @/ D2 M0 g2 S
第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。
: I2 Q/ W- C3 k) Q) D; i
8 Y) |4 l1 |( v' t4 r- w: M3 a; ]有知道的小伙伴也可以在公众号【三太子敖丙】去加我微信跟我说。
" N: M8 v5 j1 q6 e$ \
i# K; b$ l6 Y- Q) E; U执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。
* s& G+ X/ l. D0 [7 ?5 t& n3 F$ |9 j2 e; N- a) Q
数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。/ j/ ^. m* y& |% p$ Q6 ?
; o$ h: u3 y- C
可以小伙子,基础大致框架还是了解得很清楚的,我们下次深入了解下,索引和部分机制。# Z# Q7 l( ]: M: U( V5 O8 g! P
好的,我们下次见。
7 X/ X& f( ?4 ?& r+ N" k0 v# Z4 j h2 l# ]
总结# ^2 J* h) `& S+ u& T* B
& H" E* _# w2 ^: ^8 _% t% l基本上我把MySQL的逻辑架构的东西都简单聊了一遍,当然你去自信了解的话,你会发现其实里面还有很多细节的,我只是说了一些常见的问题,这还是阿里丁奇学长的《MySQL实战》的思路。
# m5 r/ C% ? E8 T2 [* q. E; O# f1 h- S- Q' @* h5 D2 w
我自己在MySQL方面更多的可能就是理论知识了,还做不到深入了解的地步,大家如果有机会一定要深入的去学习一下。
& {. l3 z- Q" [0 \————————————————$ c* K4 X! t9 F2 S8 t* c G
版权声明:本文为CSDN博主「敖 丙」的原创文章,遵循 CC 4.0 BY 版权协议,转载请附上原文出处链接及本声明。- n, T! Q% O9 h
原文链接:https://blog.csdn.net/qq_35190492/article/details/1042034664 l# [% f v) H
" L6 r" V, u( y& l9 O8 a
9 _1 m$ u& G' \5 ` |
zan
|