别谈吊不吊,即使吊打了,也没有意义。
国产模型处于一种“有性能,无功能”的状态,“毛坯房模型”,后训练非常差。
无功能,就是无效率。
无论DeepSeek,Qwen基模如何,你最终还是要用ChatGPT和Claude。你会被提示词优化折腾到放弃,而且有很多东西,后训练没有加进去的东西,提示词是提不出来的。国内有顶级做预训练的,但没有做后训练的人才,把握不了微妙细腻感。
况且中间还加着一个Gemini,不尴不尬的。
“毛坯房模型”对于开源社区是有意义的,但对一般用户没啥意义。——我们真的只在用ChatGPT和Claude的基础性能么?
不过,还是很喜欢Deepseek和Qwen,至少在基础上已经不错了。