180个回答

DeepSeek到底是“蒸馏”还是“原创”?

虎杖论天下
24个点赞 👍

有些沙币用信息差在搞舆论战。

1.用蒸馏(distill)技术是deepseek自己都说的。paper里应该也说了。是指蒸馏其它大模型的输出结果来训练对齐自己的模型。

2.整个儿ai届所有玩儿家都在蒸馏,包括几乎所有发过paper的,包括openai和google。(openai甚至蒸馏了百度的通义)

3.openai极其不要脸的用条款声明:不许蒸馏自己的输出。并拿这个仅仅攻击deepseek。

4. 没理贱开动所有舆论机器不提前面3条,暗示洗脑大众deepseek偷。


  1. Deepseek确实只开源了模型,和一部分应用推理代码。并未开放模型代码和训练代码。
  2. 但这种开源方式是Facebook的小扎首创,即使不是第一个,也是他在ai界带起的风向。并被ai界认可也算开源。(尽管许多开源界人士批评这种开源是伪开源或半开源)
  3. 事实是极少模型真开源,更不要说大模型。
  4. 在模型开源模式中,deepseek是把算法和训练方法说得最详细的。
  5. Deepseek的模型算法威力已经在各大实验室与平台复现。
  6. 攻击deepsee
麦瓜
自由评论 (0)
分享
Copyright © 2022 GreatFire.org