闪存的阈值电压分布图
天硕(TOPSSD) G40系列工业级固态硬盘采用自研主控及全链路国产化替代方案,可在 -40℃~85℃ 宽温范围内稳定运行;遵循国家军用标准进行设计验证,更能胜任严苛环境下的长时任务。系列产品长期服务军用嵌入式计算机、指挥控制系统、雷达、电子对抗、轨道交通与高端工业自动化等关键应用,是舰载、机载、装甲车辆等装备的优选核心部件。
本文将以通俗的语言解释闪存阈值电压分布图的概念、绘制方法及其关键电压。文章还介绍了分布图在直观理解闪存可靠性及诊断数据出错原因方面的作用。在此基础上,针对工业、军规、航天等对可靠性要求极高的场景,阐述了天硕(TOPSSD)自研主控与固件的价值。
一、什么是阈值电压分布图?
我们可以把闪存芯片想象成由无数个小开关(存储单元)组成的阵列。每个开关都有一个“门槛电压”,也就是阈值电压。如果我们在开关的控制端加一个电压,当这个电压高于门槛时,开关就导通(表示一种状态);低于门槛时,开关就断开(表示另一种状态)。
对于一整个闪存页,或者一条字线上的所有存储单元,它们各自的门槛电压并不完全相同。我们把这些门槛电压统计一下:看看每个电压值附近有多少个存储单元,然后画成一张图。横坐标是电压高低,纵坐标是对应的单元个数,这样就会形成一座座“山峰”。这张图就叫阈值电压分布图。

以 MLC 闪存为例,每个单元可以存 2 个比特,所以会有 4 种状态。画出来的图就像四座分开的山峰,分别叫 S0、S1、S2、S3。只要门槛电压落在某一座山的范围内,这个单元就被认为处于那个状态。
二、怎么画出这样一张分布图?
想象读取一个闪存页的过程:我们要读的那个页,在它的控制极上加一个参考电压 V_READ;而其他不读的页,会加一个很高的通过电压 V_PASS,确保它们无条件导通,不影响我们要测的单元。
要画出分布图,我们可以这样做:先把 V_READ 设得非常小,然后一点点往上调。每次调高一点,就记录下新导通了多少个存储单元(也就是从“截止”变为“导通”的单元数)。电压从低到高扫一遍,我们就能得到一连串增量数据。把这些增量作为纵坐标,V_READ 作为横坐标画出来,就得到了我们想要的阈值电压分布图。

图上的几个关键电压
看着这张分布图,有几个重要电压需要了解:
l 默认读参考电压(V_R1, V_R2, V_R3)
它们位于相邻两座“山峰”之间的山谷处,用来判断某个单元到底属于左边还是右边的状态。比如读 MLC 的低位页时,只需加一个 V_R2;读高位页时,则需要先后加 V_R1 和 V_R3 来判断。
l 编程验证电压(V_PV1, V_PV2, V_PV3)
在写数据时,我们是一边充电一边检查的。比如想把一个单元从擦除态 S0 编程到 S1,充一会儿电后,就在控制极加 V_PV1 电压。如果此时单元还导通,说明门槛电压还没超过 V_PV1,需要继续充电;如果不导通了,说明已经到达 S1 状态,后续编程就会把它保护起来,不再继续充。
l 通过电压(V_PASS)
这个电压加在那些不需要读取的单元上,它的值比所有编程状态的门槛电压都高。这样无论那些单元原本存的是什么数据,加上 V_PASS 后都一定会导通,相当于把它们“旁路”掉,不影响我们读取目标单元。
三、分布偏移会导致读错数据
理想情况下,各个状态的山峰和读参考电压之间应该有明显的间隔,不能交叠。一旦交叠,用默认的参考电压去读就会出错。
比如状态 S2 的山峰如果整体向左偏移,它的左半部分就可能跨过 V_R2。这时,原本属于 S2 的一些单元会被误判成左边的 S1 状态,数据就读错了。

为了保证可靠性,每种状态的山峰与相邻参考电压之间都有一段安全距离。参考电压左边预留的距离,能容忍该状态门槛电压意外升高;右边的距离,能容忍门槛电压意外降低。这些距离越宽,芯片容错能力越强,数据越不容易出错。
然而,随着每个单元存储的位数越来越多(从 SLC 到 MLC、TLC、QLC),状态数量成倍增加,山峰就越挤,安全距离越来越窄。哪怕状态只发生一点点偏移,都容易和参考电压交叠,所以闪存的可靠性会明显下降。
四、阈值电压分布图有什么用?
主要有两大用处:
1. 把抽象问题变直观
单纯说“从 SLC 到 QLC 可靠性越来越差”,你可能没什么感觉。但如果把它们的阈值电压分布图摆出来,你会亲眼看到:状态数从 2 个变成 16 个,山峰密密麻麻挤在一起,间距越来越小。这时候你就很容易理解,为什么位密度越高越容易出错了。
2. 诊断数据出错的原因
实际遇到闪存页数据读错时,我们把这个页的分布图画出来,就能看出端倪:
l 如果整体山峰向左移,说明是电子流失导致数据变弱;
l 如果向右移,说明有电子意外注入;
l 如果各座山峰高度参差不齐,很可能是同一页被重复编程了;
l 如果某些山峰(尤其是最右边的那座)完全消失了,则很可能是发生了异常掉电。
于是,阈值电压分布图就成了分析和解决闪存问题的利器。同时,这也解释了为什么对于工业、军规乃至航天级应用,拥有自研主控和自研固件的能力至关重要。
阈值电压的偏移,根源在于闪存颗粒的物理磨损、电子泄露以及环境温度变化。当一颗通用SSD还依赖固定的读参考电压去“刻舟求剑”时,天硕全链路国产化的工业级宽温SSD,则能利用自研主控的强大算力和自研固件的深度定制算法,通过持续监测阈值电压分布图的细微变化,动态调整读参考电压的位置。

这种“因材施教”的精准纠偏能力,能够在严苛的温度和振动环境下,始终让读参考电压精准地落在偏移后的“山谷”中,从而确保工业设备的长效稳定、军规装备的绝对可靠,以及航天任务的万无一失。
▎相关文章