502个回答,大部分都是抒情散文,真正涉及本质问题(根本性问题)的回答却几乎没有。
事实上,这次禁令影响最大的并不是小米、小鹏这种第三梯队的公司,而是已经在AI领域投入巨资的阿里、百度、字节、中移动这样的平台级公司。
并且,这次禁令产生的最大受害者也并不是HW,而是中芯国际。
由于涉及sensitive内容(*最近已经连续5个回答变成了荒原),因此在此只能描述几个简单的小问题。
a、量产问题
就在3个月之前(2024年8月),DFDG本土市场上传出了字节跳动、百度、中移动等公司正在进行关于昇腾910C的早期讨论,HW的目标则是最快在10月份开始发货。
当时,SemiAnalysis还表示,如果不面临美国的额外限制,HW在2025年可以生产130万~140万枚昇腾910C芯片。
果然,一语成谶。
3个月后,美国就宣布了最新的禁令。
而这次禁令的影响范围,除了台积电的代工产品之外,还包括昇腾芯片的核心零部件:高带宽存储芯片的断供问题。
事实上,早在3个月之前,HW就已经开始囤积用于AI芯片的高带宽存储器芯片,以应对随时可能发生的美国禁令。当时,HW甚至还通知其本地供应商备货更多的零部件,不仅因为HW可能会更难采购到这些零部件,而且还因为“预计生产变通办法可能会缩短某些部件的使用寿命”。
至于为什么“生产变通办法可能会缩短某些部件的使用寿命”?
HW没说。
一般来说,芯片的性能是通过将时钟速度[1]乘以芯片吞吐量[2]来计算。
而在HW的宣传中,从第一代昇腾910(320 TFLOPS)到第二代昇腾910B(400 TFLOPS)的理论最大性能提升则高达80 TFLOPS。
但实际上,昇腾910、910B之间的性能差距却并没有HW宣传的那么大。
首先,HW在昇腾910、910B峰值性能计算方式上的“双标”,让910B的实际理论最高性能多出了四分之一(20 TFLOPS[3])的water。而在实测中,除了每个核心增加一个矢量单元和计算方式变化之外,这两代芯片在每个周期的吞吐量几乎完全相同。
其次,昇腾910、910B昇腾两代产品都使用了 32 个AI核心,但910B使用的活跃AI核心却比第一代910要少得多,每个910B芯片仅仅只能激活20-25个核心。
那么,为什么要采用这种“挥刀自宫”的方式呢?
对此,HW当然更不会说。而中芯国际则沉默不语。
事实上,导致第二代910B的AI核心变少的根本原因,正是因为中芯国际7nm工艺的良率太低。
也就是说,由于中芯国际7nm的制造产能极其有限,而芯片中增加更多片上存储器会直接导致芯片面积增加,从而导致HW只能在芯片总AI核心设计、以及活跃AI核心方面做出(严重)妥协。
更加尴尬的是,如果考虑到AI芯片中硬件设计的难度远远低于软件[4],那么这个被卡脖子的画面将变得更加不忍直视。
b、软件与核心IP
与软件相比,AI芯片设计的门槛实际上并不高。
不仅GPGPU架构上也没有什么高深的要求,而且很多核心部件、核心功能模块都有现成的IP,例如总线接口PCIE、内存以及内存控制器的HBM、DDR、GDDR。
同时,很多加速的组件既有现成的产品,也可以用成熟的产品代替。唯一要做的就是把内部的逻辑加速单元整合起来,发挥对AI计算的优势,所以硬件上门槛不是很高,但是软件门槛很高。
这时,就形成了另一个比硬件问题更加尴尬的卡脖子问题:DFDG本土的AI核心IP基本上都是来自于国外产品的授权。
例如,PCIE目前掌握在cadence、Synopsis这样的美国公司手中。
又例如,HBM基本上只来自于镁光、三星、海力士。实际上,这也是为什么HW在3个月之前就开始囤积高带宽存储芯片的根本原因。
对于昇腾来说,尽管目前版本涉及的IP是买断的,但却面临着下一代产品更迭的问题(新一代IP无法拿到海外厂家的授权)。
这也意味着,昇腾全部的IP都面临断供的风险。
c、通用AI芯片
由于GPGPU具有更强的通用性,因此目前主流的AI加速芯片市场上,GPGPU占据的市场份额高达90%。
尤其是目前能运行大模型训练的,只有GPGPU。其中,效率最高的产品则是英伟达的A100、A800、H100、H800。
这时,也引申出了一个HW从来都不说的关键瑕疵:昇腾只能用于HW自身生态中的大模型业务,通用性差。
例如,目前大模型训练几乎都要使用32位的浮点,但昇腾910却不支持32位浮点,从而导致昇腾根本不能做GPT-3。
也就是说,昇腾芯片只能利用HW开发的框架(如MindSpore)、以及HW优化好的大模型(如盘古CV),因此,任何公开模型都必须经过HW的“深度优化”才能在HW的平台上运行。
由于这种“深度优化”存在着高度不确定性和风险性,因此也导致HW只能运行自己闭环的大模型产品。
简单来说就是,HW官宣的“昇腾910B在训练模型方面的性能已经超过了英伟达A100芯片”,前面其实存在着一长串的special color状语。
d、中芯
就在总统大选日的当天(11月5日),美国众议院外交事务委员会主席Michael McCaul亲自给美国商务部BIS副局长Alan Estevez写了一封信:
BIS未能针对华为试图逃避美国出口管制的报告采取行动,中芯为HW手机提供先进芯片、还计划为HW生产超过100万个AI处理器芯片,这都是违反美国出口禁令的铁证,“越来越多的证据表明中芯国际违反了美国出口禁令。如果CN不愿意立即同意对中芯国际所有设施及其账目进行全面审核,BIS应暂停对中芯国际所有的现有许可证。”
显然,这是比昇腾芯片停产更加致命的后果。因为一旦中芯被全面制裁,那么就不只是昇腾这一款芯片停产这么简单的问题了。
实际上,在美国政府的禁令[5]下,美国半导体行业已经开始实施与DFDG脱钩、逐步把CN公司从供应链中剔除。并且,任何有CN投资者或股东的企业都无法获得供应商资格。
尤其是美国半导体设备制造商已经通知供应商,必须停止从CN采购某些零部件,改而寻找替代货源,否则就会失去供应商资格。
目前,美国三巨头中的AMT(应用材料公司)、Lam Research(泛林集团)已经向供应商口头传达了这些禁令;而Veeco公司[6]则向供应商发出书面指令,要求立即停止使用新的CN供应商,并在2025年底前摆脱对现有CN供应商的依赖。
例如,AMT公司的供应商:沈阳富创精密设备公司今年在AMT新加坡办事处附近开设了一家工厂。该公司原本期望在新加坡设厂来为国际客户提供服务,但至今都未获得向AMT公司供货的授权。
这时,这个问题就变成了一个充满了量子叠加态的问题。。。。
由于涉及sensitive内容,【此处删除3001字】
埃米尔·齐奥朗说,难道人们还没认清,肤浅的智力游戏的时代已经结束,痛苦远比三段论来得重要,绝望的哭声要比最微妙的思想更发人深省,泪水总比笑容拥有更深的根源?
楼下保安则说,在暴力或恐怖的时代,人们藏进自己的洞穴、隐蔽自己的情感,但这些情感却根深蒂固,无论什么样的教育(洗脑)都无法彻底铲除它们。即便在一代人身上铲除了这些情感,它们仍旧会在下一代人身上显现出来。
⚠️以上内容节选自《2024房地产沉思录》,所有sensitive内容均已删除,感兴趣的童鞋可以在new base[7]中查看未删减版原稿。
参考
- ^芯片每秒可以执行的周期数
- ^芯片每个周期可以执行的操作数
- ^昇腾910、910B均能够并行运行矩阵和矢量运算,但对于昇腾910,HW只将矩阵单元执行的运算计入了芯片的峰值性能,不包括矢量单元执行的运算。而对于910B,HW却同时从矩阵和向量单元运算计入峰值性能。如果昇腾910采用同样的核算方式(即把矩阵单元和矢量单元都算入性能),其理论最高性能为340TFLOPS。因此,两者之间的实际理论最高性能提升只有60TFLOPS,而不是80TFLOPS。
- ^AI芯片设计的门槛并不是很高,GPGPU架构上也没有什么高深的要求,而且很多核心部件、核心功能模块都有现成的IP,例如总线接口PCIE、内存以及内存控制器的HBM、DDR、GDDR。很多加速的组件都有现成的产品,也可以用成熟的产品代替。唯一要做的就是把内部的逻辑加速单元整合起来,发挥对AI计算的优势,所以硬件上门槛不是很高,但是软件门槛很高。
- ^防止DFDG获得敏感的下一代半导体技术
- ^总部位于纽约州,主要提供半导体制造处理系统
- ^通过WX(naibaodedashu)加入。