能否证明在高温下运行 GPU 对显卡不利?

电器工程 硬件 电脑 图形
2022-01-12 19:38:42

如果您在 80°C 和 90°C(176°F 和 194°F)之间持续运行显卡,这实际上对显卡有害吗?即它会减少卡的寿命吗?这可以证明吗?还是只是假设?

我了解 GPU 的安全关闭温度通常为 90°C (194°F)。

3个回答

让我们研究一下失效机制,看看它们是如何受热影响的。重要的是要记住,仅仅因为故障机制随着温度的升高而发生得更快,GPU 不一定会更快地发生故障!如果一个子组件在室温下可以使用 100 年,如果它很热只能使用 20 年,而另一个子组件在开始时只能使用 1 年(但不受热影响),那么您的产品的寿命几乎不会改变温度。

我将忽略西蒙谈到的自行车问题,因为这不是我的专长。

在板级上,我可以想到一个会与头部“损坏”的主要组件:电解电容器。这些电容器会变干,众所周知,加热时它们会更快变干。(钽电容器的寿命也往往较短,但我不知道这会如何随热量变化)。

但是硅呢?

在这里,据我了解,有几件事可能会导致失败。这里的主要之一是电迁移。在电路中,穿过金属片的电子实际上会在原子周围物理移动。这可能会变得非常糟糕,以至于会导致导体中出现间隙,从而导致故障。

这张图片给出了一个很好的说明(来自 Tatiana Kozlova,Henny W. Zandbergen;Ni 纳米桥中电迁移的原位 TEM 观察):

在此处输入图像描述

这个过程随着温度呈指数增长,因此,如果温度更高,芯片的使用寿命会更短,而电迁移是失败的主要原因。

另一种机制是氧化物击穿,在电路内部,晶体管将遭受栅极击穿。这也取决于温度。但是,电压在这里的影响要大得多。

由于掺杂剂的漂移或由于热载流子注入,还存在 VT 偏移。掺杂剂漂移随温度而增加(但不太可能成为问题,尤其是数字电路,因为这是一个非常缓慢的过程)。我不确定热载流子注入的温度依赖性,但我认为电压在这里是一个更重要的因素。

但是还有一个重要的问题:这会减少多少寿命?知道了这一点,您是否应该确保您的显卡始终保持凉爽?我的猜测是否定的,除非在设计阶段出现错误。电路的设计考虑到了这些最​​坏的情况,并且如果它们被推到制造商额定寿命的极限,它们将能够生存。在人们超频电路的情况下:他们经常用来保持电路稳定的电压增加(因为它可以加快电路速度)比温度本身造成的伤害要大得多。此外,电压的增加将导致电流增加,这将显着加速电迁移问题。

是的,事实证明热量会降低电子元件的性能。金属加热时会膨胀,焊料(用于电路连接)是一种金属合金,因此加热时会膨胀。持续加热和冷却会导致接头不断膨胀和收缩,从而导致接头开裂并最终失效。

                                                      故障率与温度的关系图

显示了阿伦尼乌斯定律如何给出热量增加与半导体故障之间的相关性。本文详细介绍了热量对电子元件的影响。它更多地处理电子级别的事情,这有点超出我的知识范围

半导体结温升高与其 MTBF(平均故障间隔时间)降低之间的关系是众所周知的。

美光的这份技术说明谈到了这一点

在实践中,一旦结温接近并超过约 125˚C,故障率将呈指数级增加,因此,如果您在远低于该温度的情况下工作,则小增量可能并不那么关键。