太快了,国产AI大模型进步太快了,简直令人目不暇接。
仅就我个人观察,仅仅最近不到一个月的时间,重量级的进展至少有以下这些:
DeepSeek V3开源,性能暴打手握巨量算力的美国科技巨头,证明大模型未必需要那么“大”;
MiniMax 01开源,性能不俗的同时底层架构有重大创新,证明Transformer架构不再是唯一选择;
还有这个问题提到的DeepSeek-R1/R1-Zero,性能对标O1的同时,不同尺寸模型全面开源且允许蒸馏商用;
几家初创企业真的太强了,年轻人才和新兴公司的朝气蓬勃简直肉眼可见。
这里点名批评百度,我一直看好百度在AI大模型领域率先实现突破,百度也确实做到了。
奈何后续百度又双叒叕陷入了执行力问题,再次沦为业界“皇甫军校”,为行业输送人才的同时自己逐渐沦落。
回望前两年AI大模型浪潮席卷业界,知乎乃至全网都有不少悲观绝望的声音。
甚至还有些人冷嘲热讽,“又一次错失新兴产业革命”等言论甚嚣尘上。
当时我顶着逆风输出观点:
如果ChatGPT商业模式能够跑通,很可能是第一个遭