中国最近受到美国政府对人工智慧晶片的重大限制的打击,市场上对相关晶片供不应求。因为根据新规定,NVIDIA、AMD 和 Intel 等多家 GPU 供应商现已被禁止向中国销售特定的 AI 晶片。其中,对 NVIDIA GPU 的禁令最为严重,即使是以消费者为对象的 Geforce RTX 4090 显示卡,也因其高运算能力而被迫退出中国。
根据外媒报导,在几天前的禁令生效之前,NVIDIA 已将其板卡合作夥伴的大量 AD102 GPU 和 GeForce RTX 4090 显示卡优先运往中国。这种优先考虑可能是因为 RTX 4090 在目前世界其他地区供不应求,且该显示卡目前在美国的定价超过 2,000 美元的高价所造成。不仅如此,中国人工智慧领域的大厂还累积了大量 NVIDIA GPU 库存,可以为其人工智慧模型的产生提供动力。
现在,中国百度论坛的一位内部人士透露,中国各地正在组建专门的工厂来接收这些在禁令之前发送的 GeForce RTX 4090。一张图片展示,E工厂就堆积了同德 (PALIT) 的数百张 NVIDIA GeForce RTX 4090 显示卡,其他还有华硕 ROG STRIX 和 技嘉 Gaming OC 的显示卡。至於,这些卡的用途是什麽,想当然尔是不会用在游戏上。
事实上,NVIDIA GeForce RTX 4090 GPU 的价格不断上涨,现在已经到达即使是高阶游戏领域也难以承受每片 10,000 美元售价。然而,却有一个市场对这些显示卡非常渴望,那就是中国的国产生成式 AI 应用部分。因为出於 AI 目的,RTX 4090 已经具备软体生态系统,并且只需在软体层级进行很少,甚至无需修改即可支援最新的 LLM。根据 NVIDIA 最近宣布的消息显示,已经将 TensorRT 和 TensorRT-LLM 导入 Windows 11 PC,使其更加易於使用。因此,软体方面已经全部准备就绪情况下,这些显示卡在伺服器环境中要如何实用化,这就是组成这些工厂的目的。
报导指出,每张显示卡均采用 3 或 4 插槽设计,这代表着它会占用额外的空间,不太适合伺服器 AI 环境。所以,这些工厂的工人们正在把每张卡拆开。首先,拆卸大型冷却器,然後将包括 GPU 和 GDDR6X 记忆体在内的所有部件从主 PCB 上拆除。据称,已经设计了专门的 「参考」 板卡,为这些 AD102 GPU 和 GDDR6X 记忆体赋予了新的生命。
然後,每张显示卡都配备了更温和的双槽冷却器,采用风扇式设计。风扇冷却器有多个版本,但它们都具有相似的规格,可专门针对大型伺服器环境进行了调整,使其在这种环境中,能将多个 GPU 一起运作时的热量有效地将从散热器中散发出去。至於,新诞生的 NVIDIA GeForce RTX 4090 AI 解决方案在测试实验室中经过了严格的测试,我们可以看到 Furmark、3DMark 和大量 AI 应用程式在其上运行,以确保它们满足 AI 客户的需求。一旦一切检查完毕,这些 GPU 就会运送给中国的人工智慧公司。
这个过程也导致大量 NVIDIA GeForce RTX 4090 散热器和 PCB 涌入中国经销商市场。这些 PCB 和冷却器现在的售价非常便宜,通常不到 50 美元,因为最有价值的组件 AD102 GPU 和 GDDR6X 记忆体已经被拆开。但令人遗憾的是所有这些工程专业知识都将被浪费,这些 PCB 可能会在未来的 RTX 4090 维修中派上用场,因为这些显示卡仍然偶尔会 12VHPWR 连接器故障的情况者。
(首图来源:NVIDIA 官方脸书)