绝不只是堆砌闪存!SSD 中的软件算法你知多少 - 开源中国社区
Float_left Icon_close
绝不只是堆砌闪存!SSD 中的软件算法你知多少
局长 2017年07月30日

绝不只是堆砌闪存!SSD 中的软件算法你知多少

局长 局长 发布于2017年07月30日 收藏 70

阿里云高性能云服务器,2折起! >>> >>>  

SSD已经日渐流行,现在买电脑不挑带SSD的,都不好意思说自己真懂用户体验。和传统HDD相比,SSD由闪存构成,闪存低延迟的特性,令SSD在随机读写性能方面大幅超越HDD,这也是SSD能带来流畅操作体验的关键。但是,SSD又不仅仅只是闪存的简单组装,仅仅把闪存堆砌起来,并不能称作是SSD。调用闪存的软件算法,同样对SSD的寿命、稳定性、性能等方方面面起着重大作用。SSD中的软件算法你都了解吗?今天,就一起来谈谈SSD中有哪些软件算法吧!

SSD可不是把闪存焊在一起就能做出来的

FTL:没它SSD就无法识别

我们都知道SSD的硬件构成和HDD完全不同,因此操作系统识别HDD的很多机制,并不适用于SSD。例如,硬盘是由盘片来构成的,盘片是同心圆,把圆分成一个个小小的扇形,数据在这些扇形中储存,这些扇形就被称之为扇区。操作系统把扇区组织起来,构成FAT32、NTFS等文件系统,用户才得以访问文件/文件夹而不是一个个的扇区物理地址。基本上,操作系统建立文件系统的基础就是扇区。

HDD硬盘盘片上的扇区,SSD没有这个结构

SSD由闪存构成,没有盘片,自然也没有扇区。SSD的闪存颗粒基础单位是数据容量4KB的Page(页),Page组成Block(区),Block组成Plane(平面),最后Plane组成Die(晶片),这就是闪存的硬件架构。可见SSD没有扇区,怎么办?这就得靠一些算法来进行转换了。

SSD使用的是闪存,闪存结构和HDD不同,需要FTL层和文件系统对话

把SSD的架构虚拟成HDD的算法,叫做“FTL”(Flash Translation Lay)。FTL算法是由SSD主控提供的,比操作系统更加底层。FTL作为一个软件中间层,可以把SSD基于Page的硬件架构映射成HDD基于扇区的硬件架构。操作系统为SSD建立文件系统的时候,有了FTL,操作系统看到的东西和HDD没啥两样,就可以用传统的方法对SSD进行分区、格式化等操作,不需要使用专为SSD而生的文件系统。得益于FTL软件算法,SSD才能无缝接班HDD,没它SSD就无法识别。

GC垃圾回收:没它SSD就巨慢无比

闪存的机制是比较独特的,当你向闪存写入数据的时候,必须先把闪存中的数据擦除掉,才能写入。同时,闪存的最小读写单位是Page,但最小的擦除单位是Block。一个Block中包含了多个Page,SSD工作一段时间后,就没有哪个Block中的Page都是空白的了。如果要擦除某个Block,就必须先把这个Block中存在有效数据的Page复制备份到其他地方,接而进行擦除,这样一来才不会丢数据。

每个Page都可以写入数据,但覆盖写入需要先擦除原先的数据,一擦除整个Block都会被擦除

有效数据的Page要复制到什么地方进行备份呢?一些比较烂的产品,会把这些Page的数据复制到缓存,待到Block擦除后,再把数据写回去,这样一来SSD的写入速度就更加悲剧了——既要写原来的数据,又要写新数据。解决这个问题的,就是SSD中的GC(Gabage Collection),也就是垃圾回收算法。

GC垃圾回收算法看着有点类似碎片整理,它可以把某个Block中的存在有效数据的Page,移动到其他Block中,从而让操作系统得以擦除这整一个Block。接着再往该Block写数据,就不需要把备份到其他地方的Page也写回去了。CG发生在FTL层,不同的SSD的GC算法是不一样的,GC算法的不同,深切影响着SSD的性能。

Trim:大大提高垃圾回收效率

Trim是一种用来增加GC垃圾回收效率的算法。没有Trim的话,会出现这样一种情况:在操作系统删除一个文件,实际上数据在物理层面上并没有被删除。于是,SSD的某个Block所有Page都会被填满,待到真正写入数据的时候,才被迫进行GC垃圾回收,主控才开始把有效数据的Page移动到其他Block上,进而擦除该Block。如此一来,速度就很慢,SSD用久了每次写入数据都得先GC,用户体验非常不好。

CMD中查询“fsutil behavior QUERY DisableDeleteNotify”,如图显示就是开启了Trim

Trim就可以大大缓解这种情况。操作系统删除数据后,Trim会告诉SSD主控哪些Page的数据对应着删除的数据,这些Page会被标记成为无效Page。接着,在闲暇时段,SSD主控就会主动进行CG,把有效数据的Page移走,然后擦除这些Block的数据,提前为操作系统的数据写入准备好足够多的Block。如此一来,就算是长期使用,只要SSD不是装得太满,性能都不会有太过明显的下滑,大大提升了用户体验。Trim算法是由操作系统提供的,Win7、Android 4.3以后的操作系统都支持Trim。

磨损平衡:保证闪存寿命被均匀消耗

我们知道闪存是有擦写寿命的,例如MLC闪存只能够擦写数千次,TLC闪存只能够擦写数百次等等。其实以现在的SSD容量,总擦写数据量是非常惊人的,例如256G的SSD,寿命是500次擦写(P/E)的话,那么就需要写入125TB的数据,闪存才寿终正寝——就算你每天写入10G数据,也需要用三十多年才能把闪存给写挂,更何况很少人每天往SSD中写10G数据。

TLC的擦写次数不尽如人意,但正常使用其实也很难挂掉

但是很多朋友仍不信任SSD的寿命,理由是SSD的这个寿命,是根据全盘容量来估算的。有的朋友认为,平时读写数据,会集中读写SSD的其中一部分闪存,这部分的闪存寿命就会损耗得特别快。一旦这部分闪存挂了,那么整块SSD也就挂了。然而事实真的是这样吗?

事实当然并非如此。实际上,SSD拥有磨损平衡(Wear Leveling)算法,令所有闪存磨损度尽可能保持一致。SSD的磨损平衡算法大致分为动态和静态两种。动态的算法就是当写入新数据的时候,会自动往比较新的Block中去写,老的闪存就放在一旁歇歇;而静态的算法就更加先进,就算没有数据写入,SSD监测到某些闪存Block比较老,会自动进行数据分配,让比较老的闪存Block承担不需要写数据的储存任务,同时让较新的闪存Block腾出空间,平日的数据读写就在比较新的Block中进行——如此一来,各个Block的寿命损耗,就都差不多了。

总结

SSD绝不是把闪存堆在一起就能做成的,要让SSD稳定、快速地运行,还有赖于种种软件算法。在选用SSD的时候,可以多关注一下该SSD所使用的主控方案,关注该主控的算法是否靠谱;在使用SSD时,要选择适合的操作系统,并及时更新SSD的固件和驱动。如此一来,才会得到更好的体验。

来自:PConline原创 作者:Aimo

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:绝不只是堆砌闪存!SSD 中的软件算法你知多少
分享
评论(15)
精彩评论
4

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
因噎废食?
2

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
我顶你这个,很多人还不知道为何重要数据要放磁盘(或磁带)
2
数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
最新评论
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘

引用来自“BaiYang”的评论

1.你说的是数据可靠性,不是数据安全性。
2.数据可靠性的关键在于备份,特别是分布式多重备份,甚至离岸异地备份。任何单点都是不可靠的,特别是机械硬盘这种有机械运动部件的,抗震性能也很差的设备。

引用来自“FPE”的评论

“数据可靠性的关键在于备份”你确定正确?你试试把数据备份到ssd然后拆出来放几年看看?
您做过备份计划么?
1.备份是至少每天进行的。
2.保存备份数据的各个存储集群都是有专人负责运维的。
3.大部分备份机制都有版本控制功能,可同时保存数据的多个版本。

您不会觉得所谓“备份”就是 copy 到一个 U 盘,然后把它扔到角落里发霉吃灰吧?
0
隔行如隔山,行行出状元。——所以千万不要看不起搬家的、扫地的、送快递的:给你干,你就算有力气,也能吃苦,但是不入行,就是干不过别人。
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘

引用来自“BaiYang”的评论

1.你说的是数据可靠性,不是数据安全性。
2.数据可靠性的关键在于备份,特别是分布式多重备份,甚至离岸异地备份。任何单点都是不可靠的,特别是机械硬盘这种有机械运动部件的,抗震性能也很差的设备。
“数据可靠性的关键在于备份”你确定正确?你试试把数据备份到ssd然后拆出来放几年看看?
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
1.你说的是数据可靠性,不是数据安全性。
2.数据可靠性的关键在于备份,特别是分布式多重备份,甚至离岸异地备份。任何单点都是不可靠的,特别是机械硬盘这种有机械运动部件的,抗震性能也很差的设备。
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘

引用来自“FPE”的评论

我顶你这个,很多人还不知道为何重要数据要放磁盘(或磁带)
对,难怪有那么多人数据会丢失啊。
都用机械盘吧,哈哈哈~
0
NVME不提么?
2

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
我顶你这个,很多人还不知道为何重要数据要放磁盘(或磁带)
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘

引用来自“z1y1m1”的评论

因噎废食?
系统盘和经常访问的可重建数据使用SSD,重要数据文档使用HDD
4

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
因噎废食?
0

引用来自“calvinwilliams”的评论

数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
呵呵
0
论SSD主控的重要性
2
数据安全性(可擦写次数太少了)比开机快十来秒更重要,所以我还是选择机械硬盘
0
底层驱动软件非常重要
0
好文章。
0
长见识了
顶部