MBR:
当通过Fdisk或其他分区工具对硬盘进行分区时,分区软件会在硬盘0柱面0磁头1扇区建立MBR(Main Boot Record),即为主引导记录区,位于整个硬盘的第一个扇区,在总共512字节的主引导扇区中,主引导程序只占用了其中的446个字节,64个字节交给了DPT(Disk Partition Table硬盘分区表),最后两个字节(55 AA)属于分区结束标志。主引导程序的作用就是检查分区表是否正确以及确定哪个分区为引导分区,并在程序结束时把该分区的启动程序调入内存加以执行。
DPT:
分区表DPT(Disk Partition Table),把硬盘空间划分为几个独立的连续的存储空间,也就是分区。分区表DPT则以80H或00H为开始标志,以55AAH为结束标志。分区表决定了硬盘中的分区数量,每个分区的起始及终止扇区、大小以及是否为活动分区等。
通过破坏DPT,即可轻易地损毁硬盘分区信息。分区表分为主分区表和扩展分区表。
主分区表位于硬盘MBR的后部。从1BEH字节开始,共占用64个字节,包含四个分区表项,这也就是为什么一个磁盘的主分区和扩展分区之和总共只能有四个的原因。每个分区表项的长度为16个字节,它包含一个分区的引导标志、系统标志、起始和结尾的柱面号、扇区号、磁头号以及本分区前面的扇区数和本分区所占用的扇区数。其中引导标志表明此分区是否可引导,即是否活动分区。当引导标志为80″时,此分区为活动分区;系统标志决定了该分区的类型,如06″为DOS FAT16分区,0b为DOS FAT32分,63″为UNIX分区等;起始和结尾的柱面号、扇区号、磁头号指明了该分区的起始和终止位置。
分区表项的16个字节分配如下:
第1字节: 引导标志
第2字节: 起始磁头
第3字节: 低6位为起始扇区, 高2位与第4字节为起始柱面
第4字节: 起始柱面的低8位
第5字节: 系统标志
第6字节: 终止磁头
第7字节: 低6位为终止扇区, 高2位与第8字节为终止柱面
第8字节: 终止柱面的低8位
第9-12字节: 该分区前的扇区数目
第13-16字节: 该分区占用的扇区数目
扩展分区作为一个主分区占用了主分区表的一个表项。在扩展分区起始位置所指示的扇区(即该分区的第一个扇区)中,包含有第一个逻辑分区表,同样从 1BEH字节开始,每个分区表项占用16个字节。逻辑分区表一般包含两个分区表项,一个指向当前的逻辑分区,另一个则指向下一个扩展分区。下一个扩展分区的首扇区又包含了一个逻辑分区表,这样以此类推,扩展分区中就可以包含多个逻辑分区。为方便说明,我们把这一系列扩展分区和逻辑分区分别编号,主扩展分区为 1号扩展分区,第一个逻辑分区表所包含的两个分区分别标为 1号逻辑分区和 2号扩展分区,依次类推。
主分区表中的分区是主分区,而扩展分区表中的是逻辑分区,并且只能存在一个扩展分区。
FS即文件系统,位于分区之内,用于管理分区中文件的存储以及各种信息,包括文件名字,大小,时间,实际占用的磁盘空间等。windows 目前常用的文件系统包括FAT12,FAT16,FAT32和NTFS系统。
DBR(Dos Boot Record)是操作系统引导记录区。它位于硬盘的每个分区的第一个扇区,是操作系统可以直接访问的第一个扇区,它一般包括一个位于该分区的操作系统的引导程序和相关的分区参数记录表。
簇,是文件系统中最小的数据存储单元,由若干个连续的扇区组成,硬盘的扇区的大小是512字节(几乎是用于所有的硬盘),也就是既是一个字节的文件也要分配给它1个簇的空间,剩余的空间都被浪费了,簇越小,那么对小文件的存储的效率越高,簇越大,文件访问的效率高,但是浪费空间比较严重。
FAT(file allocation table)即文件分配表,记录了分区中簇的的使用情况,FAT表的大小与硬盘的分区的大小有关,为了数据安全起见,FAT一般做两个, 二FAT为第一FAT的备份,用于FAT12,FAT16,和FAT32文件系统。
DIR是DIRECTORY即根目录区的简写,根目录区存储了文件系统的根目录中的文件或者目录的信息(包括文件的名字,大小,所在的磁盘空间等等),FAT12,FAT16的DIR紧接在第二FAT表之后,而FAT32的根目录区可以在分区的任何一个簇。
MFT(Master File Table)是NTFS中存储有关文件的各种信息的数据结构,包括文件的大小,时间,所占据的数据空间等等。
以FAT32为例,FAT32分区的的0-2扇区为FAT32文件系统的DBR即引导扇区,3-5扇区为0-2扇区的备份。6-31扇区为空,32 扇区开始为第一个FAT表,FAT表的大小与硬盘的分区的大小有关。随后是第2个FAT表,剩余的空间都是实际的文件所占用的,包括目录和文件。 FAT32文件系统的根目录并不一定是数据区的第一个簇,它可以位于数据区的任何一个簇,这也是FAT32的根目录大小不在受255个文件限制的原因,这也是FAT32的文件名可以支持长文件名的原因之一。
分区表丢失,表现为硬盘原先所有分区或者部分分区没了,在磁盘管理器(winxp win2000 win2003)看到未分区的硬盘或者未分区的空间。有多种可能:
病毒,当年的cih病毒会用无效的数据填充分区表和第一个分区的数据,这种情况下,从前面介绍的分区的性质来看,c盘的数据很难恢复,而随后d盘和 e盘等分区的实际数据并没有被破坏,而仅仅是分区表丢失而已,所以只要找到D盘和E盘等分区的正确的起始和结束位置,很容易恢复。
重新分区,使用fdisk对磁盘重新划分空间分布,那么原来的分区表被新的分区表取代,这个时候,同样是原来分区的数据没有损坏,仅仅是分区表指向了不正确的位置。
修复分区表和文件分配表丢失导致数据丢失
例1
下面我以我帮朋友手工修复的被类似cih病毒损坏的硬盘为例讲解,当时修复硬盘的自动化工具还很少,所以我完全是手工计算来恢复分区表的,其实目前的自动化的工具也是使用类似的原理来修复,计算机来计算比人要准确得多,但是有可能产生误判,依然需要人工辅助。
判断,了解情况,了解到的是使用正常,突然系统重新启动,无法引导操作系统。20G硬盘系统分为3个分区,第一个分区是fat32,大约 5个G,第二个分区也是fat32,大约8个G,最后一个分区是NTFS,重要的数据都在第二个分区上,只要恢复第二个分区就可以了。
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/diannaorumen/)重新启动系统,发现bios可以正确识别硬盘,说明是硬盘的软故障,不需要送到数据恢复公司。
使用dos系统盘启动,运行norton 的diskedit 工具,以物理磁盘的方式访问(逻辑磁盘信息全部丢失),
发现MBR完全是无效的代码,分区表也无效,察看随后的c盘所在扇区,同样是混乱的数据,察看硬盘后面的扇区,看到很多熟悉的文件名字,判断是硬盘的前面部分被覆盖,后面数据可能没有受损。
确定D盘和E盘的开始和结束位置,在磁盘上搜索特征字符串,如55AA,是扩展分区表和分区的DBR的结束标志,或者根目录的某些特殊文件名字。由于搜索速度比较慢,因为c盘大约5g,所以可以从大约3g甚至4g的位置开始搜索,为了保险起见,我从硬盘的3g的偏移位置开始搜索DBR,规则是如55aa在扇区结尾,扇区开始有fat32的签名(OEM和FAT32等字样),随后的扇区有比较整齐的fat数据,向前63扇区是扩展分区表等等,满足的条件越多,可能性越大,经过一系列的比较和判断,(这种工作手工方法非常吃力),终于找到了d盘的dbr,也就是d盘的实际的第一个扇区,向前偏移63个扇区,发现扩展分区表完好无损,这样就找到了完整的扩展分区。
在主分区表中写入扩展分区的起始和结束信息以及相关的内容。
重新启动用DOS系统盘启动,发现了原来的D盘,数据完好无损,而E盘由于是NTFS,所以无法访问,但是相信E盘也没有损坏。
这样通过一番搜索,重建了丢失的扩展分区的分区表,100%的恢复了重要数据分区D盘。使用磁盘工具重建分区表的过程基本类似,都是通过分析相关的信息重建分区表,这次数据恢复经历,完全可以用Diskgen工具来恢复,而且更加方便一些。
例2
下面一个例子是分区表丢失,并且fat表也损坏的例子的数据恢复。
一个朋友拿着一个4G的硬盘来找我,说起动后看不到分区,但是里面有一个程序里面有关于公司的一些比较重要的数据,dbf格式的数据库,公司比较小,没有多少人懂电脑,也没有备份。我帮助他找到了大部分数据,还是有一份数据丢失了。
首先我把他的硬盘接到我的机器上,然后:
大概了解硬盘的情况,询问硬盘损坏的原因。他告诉我说打开机器,发现无法启动,主板似乎没有自检,怀疑主板坏了,换了一块主板,发现只能在bios里面找到硬盘,而不能进入系统,接到别的机器上,也看不到分区。我说可能就是分区表丢了,如果仅仅是分区表丢了的话比较简单。
粗略查看硬盘数据。运行winhex或者RunTimes的磁盘工具diskexplorer,(其他的可以进行磁盘编辑的软件也可以),如下图,
选中需要的物理硬盘。然后拖动滚动条,浏览一遍整个硬盘,可以看到一些有意义的字符串,还可以见到大批的零数据,当然更多的是看不懂的内容。这个没有关系,至少目前说明硬盘没有什么明显的物理损坏,或者逻辑坏道。
自动寻找。用Easy recovery 6里面的工具试图自动找到分区,失败了。
试图重建分区表。查看第一个扇区也就是MBR的内容,发现一塌糊涂,分区表完全损坏。如果仅仅是分区表损坏,完全可以通过搜索分区,然后根据分区的偏移重建分区表。
了解分区情况,如硬盘分几个区,每个分区大概多大,分区格式是什么。继续询问,了解到机器大概是99年左右买的,装的是win98,不知道几个分区,不知道分区格式是fat16还是fat32,不知道那个关键程序装在那个分区,不知道那个关键程序的目录名字,头晕,一问三不知阿,不过至少知道是fat格式,不是ntfs格式,而且很可能是fat32的分区格式(纯属猜测)。根据经验,一般第一个分区从第64个扇区开始,这个扇区是分区的第一个扇区,对于fat来说,是引导扇区,里面存储着BPB数据。从起始扇区一直浏览到第64个扇区,前面的扇区数据都很混乱,不像是空白的样子,怀疑被病毒改写了,看这样的症状,猜测是CIH,损坏bios,导致主板不能启动,同时搞乱C盘的数据。一直到远远超过了64个扇区的时候,也没有看到看起来可能是fa t的引导扇区的扇区。直接搜索扇区尾部的55AA,搜索了一会,似乎没有找到引导扇区。
寻找根目录。找不到引导扇区,无法定位分区的开始,从而无法定位fat文件分配表的位置。换个思路,根路径一般就在fat表后面,挨着 fat表,所以决定搜索根路径。看看我的win98的根目录,有MSDOS这个文件名字,于是搜索MSDOS这个字符串,很幸运,找到了,在大约第 16700个扇区里面,然后倒退几个扇区,发现了fat表,fat表一般是排列很整齐的数据,你打开你自己的硬盘,看看fat的16进制表示,就知道这个很整齐大概是什么样子了。这样看来,第一个分区大概在硬盘的8M(16700*512/1024/1024==8M)左右的位置开始的。 找一个磁盘编辑工具,如RunTimes的磁盘工具diskexplorer,从根路径扇区的开始位置用根路径的模式查看,熟悉的文件名字出现了,说明这里确实是根路径所在的扇区。查看fat表,似乎前面部分的fat损坏了一部分,而后面的比较完好,同时 还是没有找到引导扇区,看来引导扇区被破坏了。
再一次自动寻找。根据前面的信息,已经可以推算出大部分的信息了,但是手工劳工比较辛苦,还是试一试自动化的工具哦。再一次运行Easy recovery 6,使用Data recovery 里面的AdvancedRecovery工具,如图所示,
当硬盘上没有分区信息时候,红色箭头所指的Advanced Options按钮是可以选择设定的。第一次自动寻找的时候,就是使用了缺省的设置,所以搜索失败,根据前面的分析,设定搜索范围从16000个扇区开始,分区类型选择fat32,fat的匹配模式选择忽略fat表(缺省时候是最佳匹配),然后就可以看到 Easy recovery 6不断的显示出查找的文件。
导出重要数据。可以说Easy recovery6得恢复还是比较成功的,恢复出了相当多的目录结构,关键是我看到了lock2000目录,这就是我们要寻找的重要数据目录。其他没有关系的数据就不要了。存储lock2000目录后,打开dbf数据库,发现大部分数据库完全恢复,少部分在最后面出现了乱 码,也就是最后面的数据不太对。
最后,总共历时1个小时。基本上,数据恢复是成功的,不能恢复的部分估计是因为fat表的损坏导致Easy recovery 6无法恢复。
得到的教训是,充分利用自动化工具,但是,随着大硬盘的增多,自动化工具扫描一次非常费时间,即使4g的硬盘很小,也是比较慢的,在第一个例子中搜索20G的硬盘是很慢的,要有耐心)。所以要注意收集信息,信息收集越充分,提供给自动化工具的信息越多,数据恢复的可能也越大。
数据备份
我在前面讲的2个例子都没有备份数据,第一个例子是因为分区表彻底损坏,而我后来仅仅修改了分区表,所以我没有备份数据。第二个例子是因为现在的数据修复工具基本上考虑到了保存原始数据的必要性,一般不是直接在硬盘上操作,而是仅仅在内存中重建fat等操作,基本没有写硬盘的操作 ,因为没有对硬盘的写操作,所以不需要备份数据。但是重申一点,重要数据最好备份,否则一旦误操作,就后悔莫及了。
对于重要的数据,在数据恢复之前,必须进行扇区级别的磁盘数据备份,有很多磁盘备份工具,如 ghost ,winhex,runtime的diskexplorer,使用IA的参数,会让ghost对原始硬盘做一个按照扇区模式备份的镜像文件,这时候一般选择img格式,比较通用,命令如下,
当然使用gho格式也没有问题。或者运行ghost后,选择设定菜单中的Image All的选项,如下图,
随后就是平常的操作过程,选择要备份的硬盘,和目标镜像文件的位置和格式,再如下图。
还有很多gui的软件也可以对硬盘做这种扇区级别的备份,如runtime的diskexplorer,winhex,如下图
误删除文件的恢复
误删除文件的恢复的原理是什么呢?为什么删除文件后,又可以恢复回来?是不是所有的删除的文件都可以恢复?
当我们存储一个文件的时候,操作系统首先在一个记录所有空间使用情况的表格中,找到足够容纳我们的新文件的空间,然后把文件内容写到相对应的硬盘扇区上,最后在表格中标出该空间被占用了。
当我们删除一个文件的时候,一般并不对实际文件所占用的扇区进行操作,而是仅仅在该表格中指明那些空间是空白的了,可以分配给别的文件使用。在这个时候,被删除的文件的实际内容并没有受到破坏,可以恢复回来。如果我们删除一个文件后,又重新创建了一个文件,那么被删除文件所占用的扇区就有可能被新创建的文件所使用,这时候就无法恢复原来被删除的文件了。所以一旦错误的删除了文件,必须注意的就是不要对该文件所在的分区进行写操作了,否则有可能覆盖原来删除的文件,从而导致数据无法恢复。
对于误删除的文件,我们有很多选择,如finaldata,recover4all,easyrecovery,这些软件使用很简单,直接按照向导的指示就可以了。
下面介绍一种手工恢复被删除数据的方法,特别是使用这种自动化的方法恢复无效的时候,这种方法适合恢复有明显特征的结构简单的文件,如文本文件,如果格式复杂,就需要写一个类似的程序来恢复了。原理就是直接在分区中寻找被删除的文件的内容。
一个实例就是微软公司的vc6,vc6的ide有一个bug,一直没有修复,就是存储写好的程序代码的时候,偶然会弹出一个对话框说无法存储文件,这个时候必须再存一次才可以,如果你直接关闭vc6,就会发现刚才那个文件被删除了(这个bug是微软确认的,一直到vc6的sp5补丁也没有修复)。
我的一个朋友使用vc6的时候遇到了这个bug,而且他以为vc6出了问题,直接关闭了vc6,结果很费劲才调试好的很长的一的文件就失踪了。
我首先试用了finaldata和easyrecovery,结果找出很多以前删除的文件,就是没有需要的。没有办法的情况下,只好使用强行搜索的方法了
运行winhex,选择tools菜单中的opendisk,如图,
选择误删除的文件所在的逻辑盘c盘,选择search菜单,使用find text命令,在打开的c盘上直接搜索程序代码中的特征串增加了处理Reg_Expand_SZ,如图
经过一段时间后,如图,
把找到的代码所在扇区的前后几个扇区全部复制下来,拷贝到一个新的文件中,这样就找回了原来的代码。
对于恢复结构性很强的文档,如果自动化的方式不起作用,可以写一个小程序来搜索的同时加以判断,或者直接利用winhex提供的接口写一个脚本,如果数据很重要,这样的手段也是很需要的。如果文件分散在分区的多个位置,还需要根据文档的内部结构来重新组织文档,才能彻底恢复数据。
误格式化的原理也是非常类似,仅仅是快速格式化的时候,并没有覆盖原来的数据,所以可以恢复。