基础概念
1 .什么是数据库事务? 事务有什么特征?
数据库事务是作为单个逻辑工作单元执行的一系列操作,这些操作要么全部执行,要么完全不执行,是不可分割的工作单元。
事务的特点:
原子性
一致性
隔离性
持久性
2 .主键和外键有什么区别?
主键所在的列的值是唯一的,不能为空
外键所在的列的值可以重复,也可以为空。 无法创建对应表中不存在的外键值
3 .中断和删除有什么区别?
进行比较
中断
删除
同样的积分
删除表中的所有行
删除表中的所有行,不带where词法
同样的积分
删除记录,不删除表定义
删除记录,不删除表定义
不同之处
中断速度比delete快,使用的系统和事务日志资源少
delete每次删除一行时,都会在事务日志中为每个删除的行记录一个条目
不同之处
truncate正常返回0,中断后什么也不返回
delete返回已删除的行记录数
4 .索引的作用、优缺点?
角色:
索引大大提高了系统搜索的性能
好处:
通过创建唯一性索引,可以确保数据库表中每行的数据的唯一性
建立索引的最主要原因是大大提高了数据的搜索速度
可以加快表和表之间的连接。 特别是在实现数据的参照完整性方面特别有意义
使用分组和排序子句进行数据搜索也可以大大减少在查询中分组和排序所需的时间
索引允许您在查询期间使用优化程序来提高系统性能
缺点:
索引的创建和维护需要时间,并且随着数据量的增加需要时间
索引需要物理空间,除数据表外,每个索引还需要一定的物理空间。 创建集群索引时,所需的空间会变大
添加、删除和修改表中的数据时,索引也会动态维护,从而降低数据的维护速度
5 .编制索引有哪些注意事项
适合编制索引。
对于经常需要搜索的列,可以加快搜索速度。
作为主键的列强制列的唯一性和组织表中数据的数组结构。
连接中常用的列主要有外键,可以加快连接速度。
经常在需要根据范围搜索的列中创建索引。 因为索引已经排序,指定的范围是连续的。
在经常需要排序的列中创建索引。 因为索引已经排序,所以查询可以利用索引排序来减少查询的排序时间。
通过在WHERE子句中的列上创建索引来加快条件的确定。
不适合创建索引:
请不要对查询中很少使用的列或引用的列编制索引。 这是因为这些列很少使用,因此没有索引不会加快查询的速度。 相反,由于索引增加,系统维护速度降低,空间要求增加。
不要向数据值少(不唯一)的列添加索引。 这是因为这些列的取值很少,就像人力资源表中的性别列一样。 在查询结果中,结果集中的数据行占表中数据行的很大比例。 也就是说,因为需要在表中搜索的数据行的比例很大。 增加索引不会显著提高搜索速度。
请勿向定义为text的列中添加image和bit数据类型的索引。 这是因为这些列的数据量相当大或值很少。
如果修改性能远远大于搜索性能,请不要索引。 这是因为修正性能和检索性能矛盾。 增加索引会提高搜索性能,但会降低修改性能。 减少索引会提高修改性能,降低搜索性能。 因此,如果修改的性能远远大于搜索的性能,请不要索引。
6. SQL语句分为什么类型?
数据定义语言(DDL ) :定义数据库对象(库、表、列、索引)的操作的数据定义语言。 代表命令: CREATE、DROP、ALTER、RENAME、TRUNCATE等
数据管理语言(DML ) :定义对数据库记录的操作的数据操作语言。 代表命令:插入、删除、更新、选择等
数据控制语言(DCL ) :定义对数据库、表、字段和用户的访问权限和安全级别的数据控制语言。 代表性指示:授权、恢复、提交、回滚、保存点等
7. MySQL存储引擎有哪些,各自有哪些特点?
存储引擎是实现数据库管理系统如何存储数据、如何对存储的数据进行索引、如何更新、如何查询数据等技术的方法。 MySQL的核心是插件存储引擎,支持多个存储引擎。
主要回答下表中的MyISAM、InnoDB、Memory三个引擎即可。 不同之处在于每个功能不同,目标标记支持该引擎对应的特性。
8. MySQ
L都支持那些索引?支持的索引如下:
主键索引(primary key)
唯一索引(unique)
普通索引(index)
全文索引(fulltext) (InnoDB引擎不支持全文索引,MyISAM引擎支持全文索引)
9. 什么是存储过程?
存储过程是一个预编译的SQL 语句,优点是允许模块化的设计,就是说只需创建一次,以后在该程序中就可以调用多次。如果某次操作需要执行多次SQL ,使用存储过程比单纯SQL 语句执行要快。可以用一个命令对象(call)来调用存储过程。
10. 视图的优缺点?
优点:
对数据库的访问,因为视图可以有选择性的选取数据库里的一部分。
用户通过简单的查询可以从复杂查询中得到结果。
维护数据的独立性,试图可从多个表检索数据。
对于相同的数据可产生不同的视图。
视图可以提高安全性,必须具有足够的访问权限
缺点:
性能影响,查询视图时,必须把视图的查询转化成对基本表的查询,如果这个视图是由一个复杂的多表查询所定义,那么就无法更改数据
11. 列举几种表连接方式以及区别?
连接方式:
内连接
自连接
外连接(左、右、全)
交叉连接
连接方式说明:
内连接:只有两个元素表相匹配的才能在结果集中显示。
外连接:
左外连接:左边为驱动表,驱动表的数据全部显示,匹配表的不匹配的不会显示。
右外连接:右边为驱动表,驱动表的数据全部显示,匹配表的不匹配的不会显示。
全外连接:连接的表中不匹配的数据全部会显示出来。
交叉连接: 笛卡尔效应,显示的结果是链接表数的乘积。
12. 数据库的三范式
范式:
第一范式:当关系模式R的所有属性都不能在分解为更基本的数据单位时,称R是满足第一范式的,简记为1NF。满足第一范式是关系模式规范化的最低要求,否则,将有很多基本操作在这样的关系模式中实现不了。
第二范式:如果关系模式R满足第一范式,并且R得所有非主属性都完全依赖于R的每一个候选关键属性,称R满足第二范式,简记为2NF。
第三范式:设R是一个满足第一范式条件的关系模式,X是R的任意属性集,如果X非传递依赖于R的任意一个候选关键字,称R满足第三范式,简记为3NF. 数据不能存在传递关系,即每个属性都跟主键有直接关系而不是间接关系。
参考资料:
实际使用:三大范式只是一般设计数据库的基本理念,可以建立冗余较小、结构合理的数据库。如果有特殊情况,当然要特殊对待,数据库设计最重要的是看需求和性能,需求>性能>表结构。所以不能一味的去追求范式建立数据库
13. SQL的关键字执行顺序
SQL查询中各个关键字的执行先后顺序:
from > on> join > where > group by > with > having > select > distinct > order by > limit
参考资料:《MySQL技术内幕:SQL编程 第三章查询处理》
场景分析
1. 如果有1000万条数据,执行库查询时如何提高查询效率?
问题分析:从1000万这个数字可以定位到考察数据量特别大的情况下如何提升查询效率。
数据库设计方面
建立索引
数据表分区
尽量使用固定长度的字段
限制字段长度
分表,分库
数据库I/O方面
增加缓冲器
涉及表的级联,不同的表存储在不同的磁盘上,以增加I/O速度
改善物理设备,比如更换固态硬盘
在SQL语句方面
优化SQL语句,较少比较次数
限制返回的记录数,进行分页查询
在Java方面
反复查询,使用preparedStatement减少查询次数
考虑数据缓存,较少数据库访问