金士顿博客:企业和客户端固态硬盘的比较

2018年10月3日,星期三 通过 迈克尔·尼西奇

越来越多的高吞吐量,低延迟的业务数据中心都依赖于服务器中的硬盘驱动器(HDD),现在正面临性能瓶颈。如今,他们将固态驱动器(SSD)视为可行的存储解决方案,可以提高其数据中心的性能,效率和可靠性,同时降低运营成本(OpEx)。

要了解每个SSD类之间的区别,我们首先需要区分SSD的两个关键组件,闪存控制器和用于存储数据的非易失性NAND闪存。

在今天’在市场上,SSD和NAND闪存的消耗分为三大类:

  • 消费类设备(平板电脑,相机,手机)
  • 客户端系统(上网本,笔记本电脑,超级本,AIO,台式机),嵌入式/商用(游戏机,专用系统,数字标牌)
  • 企业计算平台(HPC,数据中心服务器)

为公司选择合适的SSD存储设备’数据中心可能是一个乏味的学习过程,其中需要测试各种不同的SSD供应商和产品类型的适用性,因为并非所有SSD和NAND闪存都是以相同的方式制造的。

SSD的制造目的是易于安装,更换或补充基于磁盘的硬盘(HDD),并具有多种不同的外形尺寸,包括2.5英寸,并具有通信协议/接口,包括串行ATA(SATA),串行连接SCSI(SAS)和最近的PCIe,用于向服务器的中央处理单元(CPU)或从服务器的中央处理单元(CPU)传输数据。

尽管SSD易于安装,但不能保证它们都适合公司长期选择的应用。如果SSD由于被覆盖而过早磨损,则在其预期使用寿命内持续写入功率会大大降低,或者它们会导致存储阵列出现额外的延迟,因此需要及早更换,因此,经常会错误选择SSD的成本抵消了所有原始成本节省和性能优势。

为了帮助您决定下一次为公司数据中心购买备用存储或其他存储,本研究着眼于区分企业级SSD和客户端级SSD的三个关键功能:性能,可靠性和耐用性。

性能

通过使用多通道体系结构以及从SSD控制器到NAND闪存芯片的并行访问,SSD可以为顺序和随机CPU数据查询实现惊人的高读写速度。

数据中心的典型方案是处理数百万字节的公司随机数据,包括技术CAD图和地震分析数据(例如大数据),或全球范围内的客户访问银行交易(例如OLTP)。必须以最低的延迟完成对存储设备的访问,而且许多客户可能有必要在不减少响应时间的情况下同时访问同一数据。用户体验基于低延迟,从而提高了用户生产力。

客户端应用程序仅影响一个用户或应用程序,并且用户或系统活动的最小和最大响应时间(或延迟)之间的容限范围更高。

不匹配的性能可能会对复杂的SSD存储阵列(例如网络连接存储,直接连接存储或存储区域网络)产生不利影响,并严重破坏用户认为的存储阵列延迟,持续性能以及最终的服务质量。

与客户端固态硬盘不同,企业级固态硬盘不仅针对访问的最初几秒钟的峰值性能进行了优化,而且还通过使用较大的超大区域(OP)在较长的时间内提供了更高的稳定性能。有关每个驱动器的更多信息,请访问Kingston网站,网址为 企业级固态硬盘.

这可确保存储阵列的性能与组织一致’s expected 服务质量(QoS),即使在峰值负载下也是如此。

可靠性

与NAND闪存相关的问题很多,其中两个最重要的问题是有限的预期寿命,因为NAND闪存单元在重复写入期间会磨损,而且正常发生的错误率也很高。

每个NAND闪存芯片在NAND闪存制造过程中均由硅晶片测试,并标有原始错误率(BER或RBER)。 BER定义了NAND​​闪存中正常发生的误码发生率,而没有纠错码(ECC)进行补偿,并且SSD控制器使用自发的Advanced ECC进行纠正(通常由不同的SSD控制器制造商称为BCH ECC或Strong)进行纠正。 ECC或LDPC)。而不中断用户或系统访问。

SSD控制器纠正这些误码的能力可以通过不可纠正误码率(UBER)来解释,“在使用某些纠错方法后,与每位读取的数据错误数相对应的数据损坏率度量”. [1]

根据行业标准协会JEDEC在2010年对文件JESD218A的定义和统一: 固态硬盘(SSD)要求和耐久性测试方法 和JESD219: 固态硬盘(SSD)耐久性工作负载,企业级与客户端级SSD的功能在许多方面有所不同,包括但不限于与客户端SSD相比,它们具有更高的写利用率,更苛刻的环境条件以及更高的BER恢复能力。 [2] [3]

应用类别工作量(请参阅JESD219)主动使用(切换到)资料保留 (关闭)UBER要求
客户客户40° C 8 hours/day30° C 1 Year≤10 – 15
企业企业55° C 24 hours/day40° C 3 Months≤10 – 16

表格1–JESD218A固态硬盘(SSD)要求和耐久性测试方法

JEDEC版权所有。经JEDEC许可转载。

根据JEDEC提出的SSD的UBER要求,在将企业SSD与客户端SSD进行比较时,假定1位误码率为10万亿位(〜1.11 PB),企业SSD只会发生1个不可恢复的误码。与客户端SSD不同,客户端SSD每1万亿位(〜0.11 PB)处理1位错误。

金士顿企业级固态硬盘还具有其他技术,可以使用存储在其他NAND裸片中的奇偶校验数据来恢复损坏的数据块(类似于RAID驱动器,它可以恢复与奇偶校验数据相关联的某些块,这些存储在其他块中,进行重建)。

为了补充金士顿企业级固态硬盘中的冗余数据突发恢复技术,在端到端内部备份系统中还实施了定期检查点,循环冗余校验(CRC)和ECC错误校正,以确保来自主机的数据的完整性通过闪存返回主机。端到端隐私意味着从主机接收的数据在存储在SSD的内部缓存中以及由NAND存储区写入或呈现时,将进行完整性检查。

与针对企业级SSD的针对位错误的改进ECC保护类似,SSD还包括功率损耗检测电路,该电路可管理SSD上的功率存储电容器。硬件中的Powerfail支持可监视SSD的输入功率,并在出现意外断电时用钽电容器为SSD电路临时供电,以在SSD关闭之前完成内部或外部挂起的写入操作。对于数据丢失不可逆的应用,通常需要使用掉电保护电路。

通过频繁地将SSD控制器缓存区域(例如,其FTranslation层表)中的数据删除到NAND存储器中,还可以在SSD固件中实现电源故障保护。虽然这不能确保断电期间不会丢失任何数据,但它会尝试最大程度地减少不安全断电的影响。固件电源故障保护还可以确保在不安全关闭后,SSD不太可能无法运行。

在许多情况下,使用软件定义存储或服务器群集可以减少对基于硬件的电源故障支持的需求,因为所有数据都被复制到不同服务器上的单独的独立存储设备中。 Web级数据中心通常会放弃电源故障支持,并在RAID服务器上使用软件定义的存储来有效地存储相同数据的冗余副本。

  1. 金士顿科技
  2. 不可纠正的误码率(UBER)JEDEC字典,
  3. JEDEC委员会JESD218A:  JESD218A:固态硬盘(SSD)要求和耐久性测试方法,JEDEC委员会

文字版权:金士顿科技

在下周将发布的本文的第二篇也是最后一部分中,我们将展示两种SSD类在耐用性方面的差异,并对所得到的结果进行简短的总结。

载入更多评论
谢谢你的意见!您的评论必须先获得批准


新密码