人们可能认为HDD无法再竞争,但他们在进行适当评估时需要考虑各个方面。如果您将具有高达2500Gbps带宽和100kIOPS操作性能的SSD与最快的HDD(能够提供250Mbps和300IOPS)进行比较,好处似乎很明显。在数据中心,我们不是简单地谈论由单个SSD和单个HDD组成的系统,就像我们在笔记本电脑中一样。所以这种比较是无效的。对于现代存储主导的应用程序,可能涉及数百个这样的单元——可能代表数PB的存储容量。
对于大规模高容量存储安装,价格/千兆字节是进行投资时需要考虑的关键参数——而在这里,硬盘仍然证明了它们的优势。在过去十年中,企业级HDD的价格/千兆字节与企业级SSD数字之间存在数量级差异。尽管降低了SSD的价格现在使它能够赶上HDD,但仍然有大约8倍的差异(比较相同的应用程序和质量等级时)。在可预见的未来,定价曲线可能会或多或少保持平行——而交叉点,如果有的话,要到2030年代的某个时候才会发生。其原因是,尽管给定容量的SSD价格正在下降,但HDD技术的创新在成本效益方面仍然无法达到SSD。不断增加的HDD容量意味着它们可以实现的价格/千兆字节比率继续使其成为极具吸引力的选择。
即使明天这个时候HDD的每千兆字节价格突然与SSD持平,也没有足够的闪存生产能力来用固态等效物替换所有HDD资源。2019年,分析公司Gartner报告称,HDD的出货量相当于890Exabyte,而SSD的总容量达到153Exabyte——因此只有HDD的16%。有趣的是,应该注意的是,考虑到8倍更好的价格/千兆字节比率,所有这些HDD资源的总成本几乎与小得多的SSD数量相同。
SSD要完全取代HDD,SSD产量需要增加6倍。仅将产量增加一倍就需要花费数千亿美元来使新晶圆厂上线,而增加6倍则需要数千亿美元来承担。此外,这只是为了让我们能够覆盖2019年安装的数据存储容量。这仍然不足以满足预计到2023年或以后需要的数千艾字节。
很明显,仅仅依赖基于闪存的方法是不切实际的。自Covid爆发以来,随着云服务活动的增加,数据中心环境中HDD的凭据得到了进一步强调。Statista最近发布的一份报告支持了这一点——表明高容量企业级硬盘的出货量将在未来几年保持增长。
前面提到单个HDD比同等SSD慢10倍以上。但是,当我们谈论超大数据存储系统时,事情就没有那么简单了。通过实施智能架构,可以将多个HDD组合在一起,以匹配包含较少数量SSD的价格可比系统的性能。在东芝实验室,我们评估了RAID10和软件定义配置中具有24到60个HDD的架构。这些能够提供大于10kIOPS和5Gbps的性能参数。因此,对于更大容量的存储系统,具有多个HDD(单位成本低得多)的解决方案将比更少的SSD(每个具有更高的单位成本)带来更好的单位容量价格。
目前的看法是基于HDD的存储解决方案消耗更多的电量。在实际工作负载的实际实施中,旋转磁盘所需的功率预算经常被高估。功耗低于通常的预期,尤其是在采用现代高容量低功率充氦驱动器的情况下。SSD制造商经常提出的另一个论点是,他们的驱动器比HDD更可靠,因为它们没有任何活动部件。这一点又被夸大了。现代企业HDD的MTTF数据为250万小时,就其工作寿命而言,可与任何SSD直接相媲美。此外,HDD对它们在其整个生命周期内可以处理的可写入数据量没有严格限制,而SSD仅具有相对有限的耐用性。随着共享数据中心资源中不断变化的工作负载变得越来越普遍,这无疑是一个优势。
总之,基于当前的价格点和未来的价格预测,可以说HDD仍然是大规模存储数据的最具商业可行性的方式。我们社会产生的数据量正在以指数级的速度增长,IDC预测到2025年,每年的数据生成量将超过175Zetabyte。因此,很明显HDD仍然发挥着至关重要的作用。SSD的价格/容量以及缺乏足够的生产输出意味着它将无法吸收当前即将到来的数据爆炸。硬盘技术更适合这样做。