如何评价deepseek正式发布的deepseek-R1与deepseek-R1-Zero模型？ - 就在刚刚，deepseek 正式发布 D...

就在刚刚，deepseek 正式发布 DeepSeek-R1，并同步开源模型权重。

性能对齐OpenAI-o1正式版

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。