数据库恢复技术三种方法,简述数据库恢复的几种方法

文章目录事务的基本概念数据库恢复概述实现故障类型恢复技术数据转储注册日志文件恢复策略事务故障恢复系统故障恢复介质故障恢复检查点的恢复技术数据库镜像

事务的基本概念

事务：数据库操作序列，不可分割的工作单元。

在关系数据库中，事务可以包含一个或多个SQL语句或一个或多个程序。程序通常包含多个事务。

的开始和结束可以由用户明确控制。如果用户没有要显示的预定义内容，DBMS将根据默认规定自动拆分事务。

事务通常以BEGIN TRANSACTION开始，以COMMIT或ROLLBACK结束。

COMMIT :提交事务的所有操作。这意味着对事务中所有数据库的更新都将写入磁盘上的物理数据库，并且事务正常结束。

ROLLBACK :如果在回滚(即事务)执行过程中发生某些故障，导致事务无法继续，则事务中对数据库的所有已完成操作都将被取消，事务启动时的状态

事务的ACID特性：

原子性(Atomicity )全部做还是不做？

一致性：事务的执行结果必须将数据库从一个一致性状态更改为另一个一致性状态。

隔离性(Isolation )另一事务不能干扰一个事务的执行。也就是说，一个事务的内部操作和所使用的数据与其他同时执行的事务是分离的，不能在同时执行的事务之间相互干扰。

提交“持久性”(Durability )事务后，对数据库中数据的更改必须是永久的，后续操作或故障不应影响其执行结果。

可能破坏ACID特性的因素：如果多个事务并行执行，则会交叉执行不同事务的操作。事务在执行过程中被强制终止。

事务是恢复和并发控制的基本单位。

数据库恢复概述数据库必须能够将数据库错误状态恢复到已知的正确状态(也称为完整性或完整状态)。故障是不可避免的

系统故障：计算机软件、硬件故障

人为故障：操作员错误、恶意破坏等。故障类型事务内部故障：事务程序本身可能发现，也可能意外，无法在事务程序中处理。事务内部的意外故障(例如，操作溢出、并发事务死锁、选择取消事务、违反了某些完整性限制)，以及APP应用程序无法处理的故障。

事务故障恢复：还原(undo )恢复程序强制回滚事务，而不影响其他事务的执行。这意味着撤消对事务所做的数据库的更改，使事务似乎根本没有启动。

系统故障称为软故障，是导致系统停止的任何事件(特定类型的硬件错误(CPU故障、操作系统故障、DBMS代码错误、系统断电) )，需要重新启动系统。

这些故障会影响所有正在运行的事务，并且不会破坏数据库。此时，主存储器的所有内容，特别是数据缓冲区的所有信息都已丢失，所有正在运行的事务未成功完成。

恢复子系统必须回滚在系统重新启动时异常终止的所有事务，并强制取消所有未完成的事务。

如果发生系统故障，则不提交事务，并且强制取消所有未完成的事务。

发生系统故障时，事务已完成，但缓冲区中的信息尚未完全写入磁盘。系统故障这些事务导致的部分或全部数据库更改丢失。这些事务提交的结果必须重新写入数据库。也就是说，它将重试所有提交的事务。

介质故障称为硬故障，是指外部存储器故障(磁盘损坏、磁头碰撞、瞬时强磁场干扰等)。

数据库或数据库的一部分被破坏，影响正在访问部分数据的事务。

出现的可能性很小，但破坏性很大。

计算机病毒是人为的故障或破坏，是一些不法分子开发的计算机程序，可以繁殖和传播。

破坏、盗窃系统内的数据，破坏系统文件。

各种故障，对数据库的影响有两种可能。一个是数据库本身已被破坏，另一个是数据库未被破坏，但数据可能不正确。这是因为事务的执行异常结束。

的技术恢复原理：利用冗馀的、存储在系统其他位置的冗馀数据重建数据库中部分破坏或非法的数据。数据转储转储是DBA将整个数据库复制并存储到磁带或其他磁盘的过程，称为备份副本或备份副本。

数据库被破坏后，可以重新装入备份副本。如果重新装入备份副本，则数据库只能恢复到转储时的状态。要恢复到出现故障时的状态，必须重新运行自转存储之后的所有更新事务。

转储需要时间。

静态转储—在系统中未执行事务时执行的转储操作。也就是说，转储开始时数据库处于一致状态，转储期间不允许访问或修改数据库，从而获得数据的一致副本。

要轻松实现，转储必须等待正在运行的用户事务结束，新的必须等待转储结束，这会降低数据库的可用性。

动态转储—在转储期间允许访问或修改数据库。这意味着转储操作与用户事务同时发生。不需要等待正在执行的用户事务结束，也不会影响新事务的执行。但是，不能保证副本中的数据正确有效。必须注册动态转储期间每个事务对数据库的修改活动，并创建日志文件。可以添加备份副本和日志文件，使数据库恢复到某个时间点的正确状态。

批量转储：一次转储所有数据库。

增量转储：一次转储一次

转储后更新过的数据。

从恢复角度看，使用海量转储得到的后备副本进行恢复往往更方便。但如果数据库很大，事务处理又十分频繁，则增量转储方式更实用更有效。

登记日志文件

日志文件(log)是用来记录事务对数据库的更新操作的文件。

以记录为单位的日志文件
内容：各个事务的开始标记(BEGIN TRANSACTION)，各个事务的结束标记(COMMIT或ROLLBACK)，各个事务的所有更新操作。以上均作为日志文件中的一个日志记录 (log record)。

每条日志记录的内容：事务标识（标明是哪个事务），操作类型（插入、删除或修改），操作对象（记录内部标识），更新前数据的旧值（对插入操作而言，此项为空值），更新后数据的新值（对删除操作而言, 此项为空值）。

以数据块为单位的日志文件，每条日志记录的内容包括：事务标识（标明是那个事务）、被更新的数据块。

日志文件的作用
事务恢复和系统故障恢复必须用日志文件。

在动态转储方式中必须建立日志文件，后备副本和日志文件结合起来才能有效的恢复数据库。

在静态转储方式中也可以建立日志文件，当数据库毁坏后可重新装入后援副本，把数据库恢复到转储结束时刻的正确状态，然后利用日志文件把已完成的事务进行重做处理，对故障发生时尚未完成的事务进行撤销处理。

登记日志文件
登记的次序严格按并行事务执行的时间次序，必须先写日志文件，后写数据库。

写日志文件操作：把表示这个修改的日志记录写到日志文件。

写数据库操作：把对数据的修改写到数据库中。

写数据库和写日志文件是两个不同的操作，在这两个操作之间可能发生故障。如果先写了数据库修改，而在日志文件中没有登记下这个修改，则以后就无法恢复这个修改了。如果先写日志，但没有修改数据库，按日志文件恢复时只不过是多执行一次不必要的UNDO操作，并不会影响数据库的正确性。

恢复策略事务故障的恢复

事务故障：事务在运行至正常终止点前被终止。

恢复子系统应利用日志文件撤消（UNDO）此事务已对数据库进行的修改。事务故障的恢复由系统自动完成，对用户是透明的，不需要用户干预。

反向扫描文件日志（即从最后向前扫描日志文件），查找该事务的更新操作。

对该事务的更新操作执行逆操作。即将日志记录中“更新前的值” 写入数据库。插入操作， “更新前的值”为空，则相当于做删除操作。删除操作，“更新后的值”为空，则相当于做插入操作。若是修改操作，则相当于用修改前值代替修改后值。

继续反向扫描日志文件，查找该事务的其他更新操作，并做同样处理。

如此处理下去，直至读到此事务的开始标记，事务故障恢复就完成了。

系统故障的恢复

系统故障造成数据库不一致状态的原因：未完成事务对数据库的更新已写入数据库，已提交事务对数据库的更新还留在缓冲区没来得及写入数据库。

恢复方法：Undo 故障发生时未完成的事务，Redo 已完成的事务。

系统故障的恢复由系统在重新启动时自动完成，不需要用户干预。

正向扫描日志文件（即从头扫描日志文件）重做(REDO) 队列: 在故障发生前已经提交的事务：这些事务既有BEGIN TRANSACTION记录，也有COMMIT记录。撤销 (Undo)队列:故障发生时尚未完成的事务：这些事务只有BEGIN TRANSACTION记录，无相应的COMMIT记录。

对撤销(Undo)队列事务进行撤销(UNDO)处理，反向扫描日志文件，对每个UNDO事务的更新操作执行逆操作。

对重做(Redo)队列事务进行重做(REDO)处理：正向扫描日志文件，对每个REDO事务重新执行登记的操作。

介质故障的恢复

重装数据库，重做已完成的事务。

装入最新的后备数据库副本(离故障发生时刻最近的转储副本) ，使数据库恢复到最近一次转储时的一致性状态。对于静态转储的数据库副本，装入后数据库即处于一致性状态。对于动态转储的数据库副本，还须同时装入转储时刻的日志文件副本，利用与恢复系统故障的方法（即REDO+UNDO），才能将数据库恢复到一致性状态。

装入有关的日志文件副本(转储结束时刻的日志文件副本) ，重做已完成的事务。首先扫描日志文件，找出故障发生时已提交的事务的标识，将其记入重做队列。然后正向扫描日志文件，对重做队列中的所有事务进行重做处理。

介质故障的恢复需要DBA介入。DBA的只需要重装最近转储的数据库副本和有关的各日志文件副本，执行系统提供的恢复命令。具体的恢复操作仍由DBMS完成。

具有检查点的恢复技术

搜索整个日志将耗费大量的时间。很多重做处理的事务实际上已经将他们的更新操作结果写到了数据库中，然而，恢复子系统又重新执行了这些操作，浪费了大量时间。

具有检查点（checkpoint）的恢复技术：在日志文件中增加检查点记录（checkpoint），增加重新开始文件，并让恢复子系统在登录日志文件期间动态地维护日志。

检查点记录的内容
建立检查点时刻所有正在执行的事务清单。
这些事务最近一个日志记录的地址。

重新开始文件记录各个检查点记录在日志文件中的地址。

动态维护日志文件：周期性地建立检查点，保存数据库状态。

将当前日志缓冲区中的所有日志记录写入磁盘的日志文件上

在日志文件中写入一个检查点记录

将当前数据缓冲区的所有数据记录写入磁盘的数据库中

把检查点记录在日志文件中的地址写入一个重新开始文件

恢复子系统可以定期或不定期地建立检查点,保存数据库状态
定期：按照预定的一个时间间隔建立检查点。

不定期：按照某种规则，如日志文件已写满一半建立一个检查点。

当事务T在一个检查点之前提交，T对数据库所做的修改已写入数据库，写入时间是在这个检查点建立之前或在这个检查点建立之时，在进行恢复处理时，没有必要对事务T执行REDO操作。

T3和T5在故障发生时还未完成，所以予以撤销。T2和T4在检查点之后才提交，它们对数据库所做的修改在故障发生时可能还在缓冲区中，尚未写入数据库，所以要REDO。T1在检查点之前已提交，所以不必执行REDO操作。

使用检查点方法进行恢复的步骤：
从重新开始文件中找到最后一个检查点记录在日志文件中的地址，由该地址在日志文件中找到最后一个检查点记录。

由该检查点记录得到检查点建立时刻所有正在执行的事务清单ACTIVE-LIST。建立两个事务队列：UNDO-LIST和REDO-LIST。把ACTIVE-LIST暂时放入UNDO-LIST队列，REDO队列暂为空。

从检查点开始正向扫描日志文件，直到日志文件结束：如有新开始的事务Ti，把Ti暂时放入UNDO-LIST队列。如有提交的事务Tj，把Tj从UNDO-LIST队列移到REDO-LIST队列。

对UNDO-LIST中的每个事务执行UNDO操作，对REDO-LIST中的每个事务执行REDO操作。

数据库镜像

介质故障是对系统影响最为严重的一种故障，严重影响数据库的可用性，且复比较费时。为预防介质故障，DBA必须周期性地转储数据库。

数据库镜像（Mirror）：DBMS自动把整个数据库或其中的关键数据复制到另一个磁盘上，DBMS自动保证镜像数据与主数据库的一致性。每当主数据库更新时，DBMS自动把更新后的数据复制过去。

出现介质故障时，可由镜像磁盘继续提供使用，同时DBMS自动利用镜像磁盘数据进行数据库的恢复，不需要关闭系统和重装数据库副本。

没有出现故障时：可用于并发操作。一个用户对数据加排他锁修改数据，其他用户可以读镜像数据库上的数据，而不必等待该用户释放锁。

频繁地复制数据自然会降低系统运行效率。在实际应用中用户往往只选择对关键数据和日志文件镜像，而不是对整个数据库进行镜像。