357个回答

分享

如何评价deepseek正式发布的deepseek-R1与deepseek-R1-Zero模型？

2025-01-19 21:51:46

知乎用户

77个点赞 👍

我以为我理解了bitter lesson的精神，即不要人工注入inductive bias，纯靠模型自己从数据里探索。

但我看到r1-zero的时候，才意识到对这件事的信心不够

r1-zero从base model出发，完全靠RL找到所有的思维过程，而没依赖任何的human prompting

要反思反思，现在的项目是不是搞得太复杂了

2025-01-20 19:00:14

Ryan

自由评论 (0)

分享