查看: 1435|回复: 0

数据库结构的优化

字体大小: 正常放大

杨利霞

5273 主题	82 听众	17万积分

TA的每日心情

	开心 2021-8-11 17:59

签到天数: 17 天

[LV.4]偶尔看看III

网络挑战赛参赛者

自我介绍: 本人女，毕业于内蒙古科技大学，担任文职专业，毕业专业英语。

群组: 2018美赛大象算法课程

群组: 2018美赛护航培训课程

群组: 2019年数学中国站长建

群组: 2019年数据分析师课程

群组: 2018年大象老师国赛优

电梯直达

1^#

发表于 2020-4-24 18:13 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

数据库结构的优化
1、选择合适的数据类型
数据类型的选择，重点在于“合适”二字，如何确定选择的数据类型是否合适了？
1、使用可以存下你的数据的最小的数据类型。（时间类型数据：可以使用varchar类型，可以使用int类型，也可以使用时间戳类型）
2、使用简单的数据类型，int要比varchar类型在mysql处理上简单。（int类型存储时间是最好的选择）
3、尽可能的使用not null定义字段。（innodb的特性所决定，非not null的值，需要额外的在字段存储，同时也会增加IO和存储的开销）
4、尽量少用text类型，非用不可时最好考虑分表。

2、数据库表的范式化优化
范式化是指数据库设计的规范，目前说道范式化一般是指第三设计范式。也就是要求数据表中不存在非关键字段对任意候选关键字段的传递函数依赖则符合第三范式。

反范式化
反范式化是指为了查询效率的考虑把原本符合第三范式的表“适当”的增加冗余，以达到优化查询效率的目的，反范式化是一种以空间来换取时间的操作。

3、数据库表的垂直拆分
垂直拆分定义
所谓的垂直拆分，就是把原来一个有很多列的表拆分成多个表，这解决了表的宽度问题。
垂直拆分原则
通常垂直拆分可以按以下原则进行：
1、把不常用的字段表单独存放到一个表中。
2、把大字段独立存放到一个表中。
3、把经常一起使用的字段放到一起。

4、数据库表的水平拆分

为什么水平拆分
表的水平拆分是为了解决单表数据量过大的问题，水平拆分的表每一个表的结构都是完全一致的

水平不拆分原因
如果单表的数据量达到上亿条，那么这时候我们尽管加了完美的索引，查询效率低，写入的效率也相应的降低。

如何将数据平均分为N份
通常水平拆分的方法为：
1、对customer_id进行hash运算，如果要拆分为5个表则使用mod（customer_id，5）取出0-4个值。
2、针对不动的hashid把数据存储到不同的表中。

水平拆分面临的挑战

1、夸分区表进行数据查询
前端业务统计：
业务上给不同的用户返回不同的业务信息，对分区表没有大的挑战。
2、统计及后台报表操作
但是对后台进行报表统计时，数据量比较大，后台统计时效性比较低，后台就用汇总表，将前后台的表拆分开。
————————————————
版权声明：本文为CSDN博主「Cgy25」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Cgy25/article/details/105690070

zan