如何看待开源模型DeepSeek综合性能吊打Openai? - 吊打OpenAI肯定谈不上，只能说跟非多...

吊打OpenAI肯定谈不上，只能说跟非多模态非推理SOTA打得有来有回，另外当前非推理的SOTA是Claude-3.5-Sonnet，不是GPT-4o。

目前DSV3在chatbot arena上也确实击败了Claude-3.5-Sonnet。Chatbot Arena是真人提问投票，因此完全不存在过拟合刷榜的可能——当然刷榜的方法也是有的，但这要求模型基础能力过硬+Post-Train舔的好，显然以DSV3薄弱的Post-Train是根本不可能实现的。

至于这对老黄是利好还是利空？我认为应该是利空——因为开源模型的性能越来越好，意味着越来越多的公司都不会选择自己从头预训练了，直接拿现成的开源模型做SFT要简单有效得多。而老黄现在只在预训练卡这个方面具有牢不可破的优势和巨大的增量需求，PostTrain既有同级竞争对手也有存量A100，推理这边更是有大量竞争对手，如果算力需求持续分化的话对于老黄来说显然是比较明显的利空。