虽然没活咬打火机,但理论上真的能给幻方造成一点麻烦,毕竟H20大显存大带宽,恰好适合MoE模型推理(前向激活参数少)——但这也不是什么必须的事情,正好催着他们赶紧发布INT8量化模型和适配Atlas300I的镜像。至于LLM训练,H20这种打不过910B的废物,除了丢人之外没有存在的价值。
PS:硅基流动上了V3和R1,看来NV彻底可以咬打火机了


华子:你说这个我就不困了哈
虽然没活咬打火机,但理论上真的能给幻方造成一点麻烦,毕竟H20大显存大带宽,恰好适合MoE模型推理(前向激活参数少)——但这也不是什么必须的事情,正好催着他们赶紧发布INT8量化模型和适配Atlas300I的镜像。至于LLM训练,H20这种打不过910B的废物,除了丢人之外没有存在的价值。
PS:硅基流动上了V3和R1,看来NV彻底可以咬打火机了


华子:你说这个我就不困了哈