我很遗憾地告诉你RAID 5即将在2009年被RAID 6完全取代。但是好消息是这个行业已经先你之忧而忧,采取了实际行动,开发出新的解决方案。
我发现之前一篇关于URE(Unrecoverable Read Error,不可恢复的读取错误)的文章招来了一些负面影响。很多见多识广的读者发表评论,指出我数学上的错误——我在研究生院里学过两门关于统计的课程,那是很久以前的事情了——并且对我的一些论点提出了不同看法。这很好。
让我感到有趣的是,在我的那篇日志里,并没有提到什么新鲜事,里面的内容都是这个行业里的人已经熟知多年的。例如,Intel在去年发布的白皮书里这样表示:
智能RAID 6理论综述和实施
企业通常出于数据保护的目的,在自己的业务环境中使用RAID 5。但是,RAID 5系统最多允许一块驱动器的故障,所以随着磁盘容量的增加和阵列带宽的增加,遇到驱动器隐蔽故障的可能性接近100%。
每个从事RAID业务的工程师都了解这一点。所以:a) ZDnet那些以技术为导向的读者为什么不会做出情绪化的反应? b)为什么根据厂商自己的技术说明提出的统计观点会遭到这么多情绪化的反应?
对RAID的错误信心
除了关于我沟通能力的问题,我还看到其他几个观点:
我的RAID工作状况非常好(因此就会永远持续下去吗?)
哗众取宠,大骗子,我不相信你。
权力总是会让人们吃惊。
这让我想起一个SOHO/SMB RAID设计人员在几个月前发表的一条评论:
我一直是RAID的支持者,可是我发现我们的用户对于RAID过于信任,他们把所有的数据保存在NAS上,然后把存放其他地方的数据都删除了。很多时候,他们并没有为自己的数据制订离站存储策略。
阵列厂商对此非常重视
经常阅读我的文章的读者应该知道我并不是阵列厂商们的“粉丝”。我对目前的解决方案架构一直持批评态度:磁盘容量实际上只占到整个解决方案价格的10%。我相信应该有更好、更经济的办法来保护我们的数据。
但是行业工程师们确实对数据可用性和完整性非常重视。因为他们使用大量的设备,所以和普通用户相比,他们对绝大部分的问题都有更深刻的见解。
这也就是为什么每个厂商都提供某种RAID 6的版本,以保护双重错误。即使是容量更小一些的企业磁盘,按照10^15(10^15指的是每125TB出现1 URE)的故障率计算,磁盘故障+URE也不太可能造成数据丢失。可是因为对于重要任务环境来说,即使是在磁盘故障后出现阵列读取错误的概率只有1%,这个概率仍然是太高了,所以对于这样的企业我们仍然推荐使用RAID 6。
行业并没有停止发展的脚步
这个行业还采取了一些其他的行动,包括:
4K行动——驱动器厂商多年来一直在游说操作系统厂商,将块的大小从512B提高到4KB,这就可以在不太影响容量的情况下使用更强大的ECC(纠错码)。听说微软也许有可能真的接受这一提法。你下一次见到Ballmer的时候,可以问问他。为什么要等Apple走在前面呢?
一些阵列带有后台扫描特性,搜索出已经出现的可恢复读取错误,然后在它们造成问题之前,重写或清除掉它们。
NAS设备将多块磁盘虚拟成一个池,这样可以结合它们的文件系统知识,以确保每个文件的数据冗余,获得更高的可用性。在一个没有使用的块上出现的URE不会造成问题,因为NAS文件系统知道那些块在使用,而哪些没有。
诸如ZFS之类的高级文件系统,结合了文件系统和卷管理功能,它们可以将奇偶数据和Parent-block Checksum结合在一起,一起对RAID设备进行改造。上面的列表中,对于整个行业采取的各种行动仅仅是点到即止,整个行业采取了很多方法,希望在提高磁盘驱动器容量的同时保证数据的可用性和完整性。RAID 5即将走到自己生命的尽头,但是你的数据仍然可以安全地“活”下去。
我发现之前一篇关于URE(Unrecoverable Read Error,不可恢复的读取错误)的文章招来了一些负面影响。很多见多识广的读者发表评论,指出我数学上的错误——我在研究生院里学过两门关于统计的课程,那是很久以前的事情了——并且对我的一些论点提出了不同看法。这很好。
让我感到有趣的是,在我的那篇日志里,并没有提到什么新鲜事,里面的内容都是这个行业里的人已经熟知多年的。例如,Intel在去年发布的白皮书里这样表示:
智能RAID 6理论综述和实施
企业通常出于数据保护的目的,在自己的业务环境中使用RAID 5。但是,RAID 5系统最多允许一块驱动器的故障,所以随着磁盘容量的增加和阵列带宽的增加,遇到驱动器隐蔽故障的可能性接近100%。
每个从事RAID业务的工程师都了解这一点。所以:a) ZDnet那些以技术为导向的读者为什么不会做出情绪化的反应? b)为什么根据厂商自己的技术说明提出的统计观点会遭到这么多情绪化的反应?
对RAID的错误信心
除了关于我沟通能力的问题,我还看到其他几个观点:
我的RAID工作状况非常好(因此就会永远持续下去吗?)
哗众取宠,大骗子,我不相信你。
权力总是会让人们吃惊。
这让我想起一个SOHO/SMB RAID设计人员在几个月前发表的一条评论:
我一直是RAID的支持者,可是我发现我们的用户对于RAID过于信任,他们把所有的数据保存在NAS上,然后把存放其他地方的数据都删除了。很多时候,他们并没有为自己的数据制订离站存储策略。
阵列厂商对此非常重视
经常阅读我的文章的读者应该知道我并不是阵列厂商们的“粉丝”。我对目前的解决方案架构一直持批评态度:磁盘容量实际上只占到整个解决方案价格的10%。我相信应该有更好、更经济的办法来保护我们的数据。
但是行业工程师们确实对数据可用性和完整性非常重视。因为他们使用大量的设备,所以和普通用户相比,他们对绝大部分的问题都有更深刻的见解。
这也就是为什么每个厂商都提供某种RAID 6的版本,以保护双重错误。即使是容量更小一些的企业磁盘,按照10^15(10^15指的是每125TB出现1 URE)的故障率计算,磁盘故障+URE也不太可能造成数据丢失。可是因为对于重要任务环境来说,即使是在磁盘故障后出现阵列读取错误的概率只有1%,这个概率仍然是太高了,所以对于这样的企业我们仍然推荐使用RAID 6。
行业并没有停止发展的脚步
这个行业还采取了一些其他的行动,包括:
4K行动——驱动器厂商多年来一直在游说操作系统厂商,将块的大小从512B提高到4KB,这就可以在不太影响容量的情况下使用更强大的ECC(纠错码)。听说微软也许有可能真的接受这一提法。你下一次见到Ballmer的时候,可以问问他。为什么要等Apple走在前面呢?
一些阵列带有后台扫描特性,搜索出已经出现的可恢复读取错误,然后在它们造成问题之前,重写或清除掉它们。
NAS设备将多块磁盘虚拟成一个池,这样可以结合它们的文件系统知识,以确保每个文件的数据冗余,获得更高的可用性。在一个没有使用的块上出现的URE不会造成问题,因为NAS文件系统知道那些块在使用,而哪些没有。
诸如ZFS之类的高级文件系统,结合了文件系统和卷管理功能,它们可以将奇偶数据和Parent-block Checksum结合在一起,一起对RAID设备进行改造。上面的列表中,对于整个行业采取的各种行动仅仅是点到即止,整个行业采取了很多方法,希望在提高磁盘驱动器容量的同时保证数据的可用性和完整性。RAID 5即将走到自己生命的尽头,但是你的数据仍然可以安全地“活”下去。


数据恢复技术的挑战才会让
淄博最专业的硬盘数据恢复


麻烦管理员给点建议,谢谢~~