【IT168 专稿】存储是目前IT产业发展的┅大热点而RAID技术是构造高性能、海量存储的基础技术,也是构建网络存储的基础技术专家认为,磁盘阵列的性能优势得益于磁盘运行嘚并行性提高设备运行并行度可以提高磁盘的性能和数据安全性。
等其中最广泛的包括RAID5与RAID10。但是一直以来关于RAID5与RAID10的性能优劣的争端還是非常多的,甚至很多人包括很多公司都那拿出了测试数据而这些测试数据复杂难懂相互矛盾,更加让用户感到迷惑不知道如何选擇。
在这里我将就这两种RAID的内部运行原理来分析一下,看看我们在什么情况下应当适合选哪一种RAID方式根据我的经验与分析:象小io的数據库类型操作,如ERP等等应用建议采用RAID10,而大型文件存储数据仓库,如医疗PACS系统、视频编辑系统则从空间利用的角度建议采用RAID5。下面請看详细的性能对比:
本文分为上下两篇上文侧重分析两种RAID的内部运行原理,下文将根据不同的影响磁盘性能的因素来分析RAID方案对磁盤系统的影响,参考“ ”
为了方便对比我这里拿同样多驱动器的磁盘来做对比,RAID5选择3D+1P的RAID方案RAID10选择2D+2D的Raid方案,分别如图:
那么我们分析洳下三个过程:读,连续写随机写,但是在介绍这三个过程之前,我需要介绍另外一个磁盘阵列中的重要概念:cache
磁盘读写速度的关鍵之一:Cache
cache技术最近几年,在磁盘存储技术上发展的非常迅速,作为高端存储cache已经是整个存储的核心所在,就是中低端存储也有很大嘚cache存在,包括最简单的RAID卡一般都包含有几十,甚至几百兆的RAID cache
cache的主要作用是什么呢?作为缓存cache的作用具体体现在读与写两个不同的方媔:作为写,一般存储阵列只要求数据写到cache就算完成了写操作当写cache的数据积累到一定程度,阵列才把数据刷到磁盘可以实现批量的写叺。所以阵列的写是非常快速的。至于cache数据的保护一般都依赖于镜相与电池(或者是UPS)。
cache在读数据方面的作用一样不可忽视因为如果所需要读取的数据能在cache中命中的话,将大大减少磁盘寻道所需要的时间因为磁盘从开始寻道到找到数据,一般都在6ms以上而这个时间,对于那些密集型I/O的应用可能不是太理想但是,如果能在cache保存的数据中命中一般响应时间则可以缩短在1ms以内。
不要迷信存储厂商的IOPS(烸秒的io数)数据他们可能全部在cache命中的基础上做到的,但是实际上你的cache命中率可能只有10%。
介绍完cache我们就可以解释RAID5与RAID10在不同的模式下,工作效率问题了那么我们来分别分析读操作、连续写和离散写三方面的问题。
如我上文的介绍磁盘阵列读操作的关键更多的体现在cache嘚命中率上。所以RAID5和RAID10在读数据上面,他们基本是没有差别的除非是读的数据能影响cache命中率,导致命中率不一样
连续写方面的性能差異 连续写的过程,一般表示写入连续的大批量的数据如媒体数据流,很大的文件等等连续写操作大多数产生于医疗PACS系统、高教图书馆系统、视频编辑系统等等应用环境下。
根据我本人的经验在连续写操作过程,如果有写cache存在并且算法没有问题的话,RAID5比RAID10甚至会更好一些虽然也许并没有太大的差别。(这里要假定存储有一定大小足够的写cache而且计算校验的cpu不会出现瓶颈)。
因为这个时候的RAID校验是在cache中唍成如4块盘的RAID5,可以先在内存中计算好校验同时写入3个数据+1个校验。而RAID10只能同时写入2个数据+2个镜相
如上图所示,4块盘的RAID5可以在同时間写入1、2、3到cache并且在cache计算好校验之后,我这里假定是6(实际的校验计算并不是这样的我这里仅仅是假设),同时把三个数据写到磁盘而4块盘的RAID10不管cache是否存在,写的时候都是同时写2个数据与2个镜相。
根据我前面对缓存原理的介绍写cache是可以缓存写操作的,等到缓存写數据积累到一定时期再写到磁盘但是,写到磁盘阵列的过程是迟早也要发生的所以RAID5与RAID10在连续写的情况下,从缓存到磁盘的写操作速度會有较小的区别不过,如果不是连续性的强连续写只要不达到磁盘的写极限,差别并不是太大
这里可能会较难理解,但是这一部汾也是最重要的部分。企业中的绝大部分数据库应用如ERP系统等等在数据写入的时候其实都是离散写。
例如oracle 数据库每次写一个数据块的数據如8K;由于每次写入的量不是很大,而且写入的次数非常频繁因此联机日志看起来会像是连续写。但是因为不保证能够添满RAID5的一个条帶(保证每张盘都能写入)所以很多时候更加偏向于离散写入。
我们从上图看一下离散写的时候RAID5与RAID10工作方式有什么不同。如上图:我們假定要把一个数字2变成数字4那么对于RAID5,实际发生了4次io:
如上图我们可以看到:对于RAID10同样的单个操作,最终RAID10只需要2个io而RAID5需要4个io。
这裏我忽略了RAID5在那两个读操作的时候可能会发生读命中操作的情况。也就是说如果需要读取的数据已经在cache中,可能是不需要4个io的这也證明了cache对RAID5 的重要性,不仅仅是计算校验需要而且对性能的提升尤为重要。我本人曾经测试过在RAID5的阵列中,如果关闭写cacheRAID5的性能将差很哆倍。
当然我并不是说cache对RAID10就不重要了,因为写缓冲读命中等,都是提高速度的关键所在不过的是,RAID10对cache的依赖性没有RAID5那么明显而已
箌这里,大家应当也大致明白了RAID5与RAID10的原理与差别了一般来说,象小io的数据库类型操作建议采用RAID10,而大型文件存储数据仓库,则从空間利用的角度可以采用RAID5。
上面主要从磁盘系统的内部运行细节分析了RAID5与RAID10的异同以及各自适用的范围。本文将接续上篇继续从RAID原理来汾析存储系统的瓶颈。
我们知道在存储系统的采购过程中,厂商往往能够提供漂亮的性能参数但实际运行中,该系统的实际性能表现並不能达到我们所期望的状态那么在运行环境中存储系统的实际性能究竟受哪些环节和瓶颈的影响呢?
之所以要和大家来讨论这个问题是因为在本人的工作中曾遇到一个实际的Case,在这个case中一个恢复压力很大的standby(这里主要是写,而且是小io的写)采用了RAID5的方案,发现性能很差后来改造成了RAID10,就很好的避免了性能的问题
建议在阅读本文前,首先阅读本文上篇“”因为性能瓶颈的出现,本身与RAID方式还昰有很大关系同时本文性能讨论的基础,本身建立在上文的一些结论之上
阵列的瓶颈主要体现在2个方面,带宽与IOPS(单位时间传输的数據量和单位时间完成的I/O数)。
存储系统的带宽主要取决于阵列的构架光纤通道的大小(我们今天讨论的阵列一般都是光纤阵列, SCSI这样嘚SSA阵列暂时不在讨论范围之列)以及硬盘的个数。
所谓阵列构架影响存储系统带宽指的是存储系统内部架构会存在一些内部带宽,类姒于PC的系统总线尽管阵列的构架因不同厂商不同型号的产品而各有不同,不过一般情况下内部带宽都设计的很充足,不会是瓶颈的所茬
光纤通道对带宽的影响还是比较大的,例如数据仓库环境中对数据的流量要求很大,而一块2Gb的光纤卡所能支撑的最大流量应当是2GB/8=250Mb/s嘚实际流量,必须配备4块光纤卡才能达到1Gb/s的实际流量所以对于数据仓库的环境来说,升级到光纤4Gb并非是厂商过于超前的产品更新在大鋶量的数据环境下绝对有必要考虑更换4GB的光纤卡。
但是对于存储系统的带宽来说硬盘接口的带宽限制是最重要的。当前面的瓶颈不再存茬的时候带宽就完全取决于硬盘的个数了,我下面列一下不同规格的硬盘所能支撑的流量大小数据取自硬盘厂商的标准参数:
如果我們假定一个阵列有120块15K rpm转速的光纤硬盘,那么硬盘上最大的可以支撑的数据流量为120*13=1560Mb/s当前端接口不成为瓶颈的时候,1560Mb/s就是理论上的最大数据鋶量
而如果要实现上述的最大带宽,如果前端采用2GB的光纤卡可能需要配置6块才能够,而4GB的光纤卡配置3-4块就够了。因此我们可以知道前端的光纤接口必须与后端磁盘个数相匹配。
但是否考虑到这些因素就足够了呢存储系统的整体性能还受到多方面因素的影响,下面峩们将分析存储系统的另外一个重要的性能指标:IOPS
影响IOPS的主要因素
我们前面已经说过了,厂商所提供的IOPS值是在理想状态下测试出来的對实际的运行性能的参考并不大,所以我们有必要通过以下几个方面来衡量该系统的实际IOPS的可能表现
决定IOPS的主要因素取决于阵列的算法,cache命中率以及磁盘个数。
阵列的算法也因为不同厂商不同型号的产品而不同如我们最近遇到在HDS USP上面,可能因为ldev(lun)存在队列或者资源限制而单个ldev的IOPS就上不去。所以决定采购某型号的存储之前,有必要了解这个存储的一些算法规则与限制
cache命中率对实际IOPS有决定性的影响,Cache命中率取决于数据的分布cache size的大小,数据访问的规则以及cache的算法,如果完整的讨论下来这里将变得很复杂,可以有一天来慢慢讨论
峩们这里把这些内部原理都省略掉,只强调:对于一个存储阵列来说读cache的命中率越高,一般就表示它可以支持更多的IOPS为什么这么说呢?这个就与我们下面要讨论的硬盘IOPS有关系了
每个物理硬盘能处理的IOPS是有限制的,如
同样如果一个阵列有120块15K rpm转速的光纤硬盘,那么它能支撑的最大IOPS为120*150=18000,这个为硬件限制的理论值如果超过这个值,硬盘的响应可能会变的非常缓慢而不能正常提供业务较高的读cache命中率,能降低硬盘的IOPS负荷让硬盘在较小的压力下良好工作。
在我们的上一篇文章“(上)”中曾经讨论过在RAID5与RAID10的不同机制上,读数据时IOPS性能其實没有差别。但是相同的业务,在写入数据时采用不同的RAID机制最终落在磁盘上的IOPS是有差别的,我们评估的正是磁盘的整体IOPS如果达到叻磁盘的限制,性能肯定是上不去了
那我们假定一个case,业务应用的IOPS是10000读cache命中率是30%,读IOPS为60%写IOPS为40%,磁盘个数为120那么分别计算在RAID5与RAID10的情況下,每个磁盘的IOPS为多少
/chrome/answer/6213033 NPAPI 插件无法在 Chrome 42 版及更高版本上正常运行 您可以利用插件在浏览器中添加一些额外的功能.例如,您可以观看某些类型嘚视频或者玩网页版游戏. NPAPI 支持已结束 过去,许多插件都是使用一种称为 NPAPI 的旧系统开发的.如今,只有少量网站在使用 NPAPI 插件,因为这些插件有时会给網站带来安全风险. 为了让用户获得更安全.更快速且更稳定的 Chrome 浏览体验