357个回答

如何评价deepseek正式发布的deepseek-R1与deepseek-R1-Zero模型?

知乎用户
81个点赞 👍

太快了,国产AI大模型进步太快了,简直令人目不暇接。

仅就我个人观察,仅仅最近不到一个月的时间,重量级的进展至少有以下这些:

DeepSeek V3开源,性能暴打手握巨量算力的美国科技巨头,证明大模型未必需要那么“大”;

MiniMax 01开源,性能不俗的同时底层架构有重大创新,证明Transformer架构不再是唯一选择;

还有这个问题提到的DeepSeek-R1/R1-Zero,性能对标O1的同时,不同尺寸模型全面开源且允许蒸馏商用;

几家初创企业真的太强了,年轻人才和新兴公司的朝气蓬勃简直肉眼可见。

这里点名批评百度,我一直看好百度在AI大模型领域率先实现突破,百度也确实做到了。

奈何后续百度又双叒叕陷入了执行力问题,再次沦为业界“皇甫军校”,为行业输送人才的同时自己逐渐沦落。


回望前两年AI大模型浪潮席卷业界,知乎乃至全网都有不少悲观绝望的声音。

甚至还有些人冷嘲热讽,“又一次错失新兴产业革命”等言论甚嚣尘上。

当时我顶着逆风输出观点:

如果ChatGPT商业模式能够跑通,很可能是第一个遭
现实主义理想者
自由评论 (0)
分享
Copyright © 2022 GreatFire.org