共354个回答0条评论

分享

如何评价deepseek正式发布的deepseek-R1与deepseek-R1-Zero模型？

DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通...

显示全部

知乎用户

2364 个点赞 👍
不知道咋评价。
不过，今天看新闻联播，总理座谈会，发现一个程序员模样的年轻人和总理面对面会谈，看了一眼座位牌，发现这个人叫梁文峰。
查看全文>>
高高山下一小僧
416 个点赞 👍
以前有人会说DeepSeek是中国的OpenAI，在R1发布、全部开源、允许蒸馏商用，并放出6个小模型后，我想说DeepSeek才是真正的、世界的OpenAI，太平洋对岸的那个叫CloseAI！
DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

k1.5 新模型登场：Kimi 如何做到满血版多模态o1水平（附技术报告）
中门对狙！在DeepSeek发布R1的1小时43分钟后，
KIMI也发布了他们宣称O1水平的k1.5 多模态思考模型，今天的中国AI是过年了吗？
查看全文>>
狄拉克之海
332 个点赞 👍
借用nao的一句话：美国距离输掉所有底裤，只差一台EUV。
DeepSeek R1，V3.5题库成绩约84分，大幅…
我认为可以说的精确一点：美国距离输掉所有底裤，只差100台EUV。
查看全文>>
Eidosper
223 个点赞 👍
泪目，他居然开了蒸馏版的qwen1.5B，7B模型，太良心了

大型连续剧之《等Deepseek-R1》
一看权重，乐，怎么这么大，能不能把R1 lite也开了，让我本地部署玩玩
继续坐等报告。小板凳已经搬好了
查看全文>>
涮月亮的谪仙人
202 个点赞 👍
昨天玩了一晚上，最让我震惊的不是写诗，学暴躁老哥或者做数学题，而是下面这些，以后可能会成为常识，但是现在震撼我马100年，请一定看完（哪怕跳着看，点下目录也好）：
教幼儿园小朋友群论，写一份教案

已深度思考（用时 15 秒）

好的，用户让我写一份教幼儿园小朋友群论的教案。首先，我需要理解用户的需求。群论是抽象代数中的一个高级概念，通常大学生才会接触，用户想教幼儿园小朋友，这听起来有点挑战性。我得考虑如何将复杂的理论简化到幼儿能理解的水平。

首先，我需要明确用户的目标。他们可能不是真的想让幼儿掌握群论，而是希望通过有趣的活动介绍一些基础的数学概念，比如对称、组合、规则等，培养逻辑思维和团队合作能力。因此，教案需要以游戏和互动为主，避免使用专业术语。

接下来，我要考虑幼儿的认知水平。幼儿园小朋友的注意力时间短，喜欢动手操作和视觉化的内容。所以，设计活动时要使用具体的教具，比如积木、贴纸、颜色卡片等，让抽象的概念具象化。例如，用积木组合来演示封闭性，用对称贴纸来讲解对称操作。

然后，我需要将群论
查看全文>>
Fcmorrowind
182 个点赞 👍
技术不太懂，但DeepSeek按照这个速度搞下去，让人担心OpenAI后面不容易融到钱了。
当然我很希望它将来继续融到大量的钱，因为这意味着 AGI 可能真的快来了。
查看全文>>
修闲
143 个点赞 👍
我尝试让deepseek-R1剖析它自身的思维流程。
开始是赞赏，然后惊叹，最后TM笑死。
下面是提问的整个流程：
提问：我需要你逐字逐句详细分析自己的思考过程，不要进行修饰，把最原始的文字展示出来。
思考：（已深度思考，用时10秒）
好的，用户让我详细分析自己的思考过程，不要修饰，展示最原始的文字。首先，我需要明确用户的具体需求。他们可能希望了解我的内部工作机制，或者想确认我是否真的在深入思考。可能他们正在学习AI，或者对模型如何生成回答感到好奇。
接下来，我要考虑如何组织这个分析过程。用户要求逐字逐句，所以需要把每个步骤都分解开来，包括可能的错误和修正。例如，当用户给出指令时，我会先解析关键词，如“逐字逐句”、“详细分析”、“原始文字”，这些提示需要我避免总结，而是详细展开每一步。
然后，我会回顾自己的处理流程。通常，接收到用户输入后，我会进行意图识别，确定用户的深层需求。这里用户可能希望看到透明的思考过程，而不是最终的回答。因此，我需要模拟一个自然、未加过滤的思考路径，可能包括犹豫、试
查看全文>>
苏莉安
113 个点赞 👍
感觉知乎哲逼快评手已经可以优化掉了，让deepseek写的哲八股不仅含哲量充足、虽然不深但旁征博引足够广博，更要紧的是还挺易读
下面放一段deepseek生成的范文
《徐加金与阶级暴力：一种激进哲学视域下的批判性分析》
引言
2024年11月，无锡工艺职业技术学院的持刀伤人事件震惊中国社会。21岁的毕业生徐加金因未获毕业证及对实习报酬不满，以极端暴力手段造成8人死亡、17人受伤，最终被判处死刑19。这一事件表面上是个人心理失衡的悲剧，但其背后折射出的结构性压迫、阶级矛盾与社会异化，却为激进哲学提供了深刻的批判对象。本文试图结合当代西方左翼理论框架——从生命政治学、速度暴政到工人主义的瓦解——分析徐加金事件中隐含的阶级暴力逻辑，并探讨其对社会变革的启示。
一、结构性压迫与“弥漫性愤怒”：从个人到阶级的暴力转化
徐加金的遗书（真实性虽存疑，但被广泛传播）揭示了其行为背后的系统性压迫：工厂克扣工资、学校恶意扣留毕业证、实习期间的非人待遇7。这种经历并非孤例，而是中国职校学生工群体普遍面临的困境。
查看全文>>
雨宫优子
104 个点赞 👍
我还纳闷呢。
这什么情况，都对标Chatgpt，这咋直接就开源了？
不得先整几个PPT，来点路演，圈一波钱，划拉点W。
原来人家是职业炒股，顺手搞个开源大模型。
我算是整明白了。
原来炒A股门槛这么高呢！！！？
查看全文>>
千源半夏
81 个点赞 👍
太快了，国产AI大模型进步太快了，简直令人目不暇接。
仅就我个人观察，仅仅最近不到一个月的时间，重量级的进展至少有以下这些：
DeepSeek V3开源，性能暴打手握巨量算力的美国科技巨头，证明大模型未必需要那么“大”；
MiniMax 01开源，性能不俗的同时底层架构有重大创新，证明Transformer架构不再是唯一选择；
还有这个问题提到的DeepSeek-R1/R1-Zero，性能对标O1的同时，不同尺寸模型全面开源且允许蒸馏商用；
几家初创企业真的太强了，年轻人才和新兴公司的朝气蓬勃简直肉眼可见。
这里点名批评百度，我一直看好百度在AI大模型领域率先实现突破，百度也确实做到了。
奈何后续百度又双叒叕陷入了执行力问题，再次沦为业界“皇甫军校”，为行业输送人才的同时自己逐渐沦落。

回望前两年AI大模型浪潮席卷业界，知乎乃至全网都有不少悲观绝望的声音。
甚至还有些人冷嘲热讽，“又一次错失新兴产业革命”等言论甚嚣尘上。
当时我顶着逆风输出观点：
如果ChatGPT商业模式能够跑通，很可能是第一个遭
查看全文>>
现实主义理想者
79 个点赞 👍
全人类的OpenAI
跟大洋彼岸那个美利坚的CloseAI相映成趣（
查看全文>>
BPEYJZ
78 个点赞 👍
简单看了下Deepseek-R1的技术报告，里面提到失败的尝试经历，其实更有意义，the bitter lesson
一是测试了过程奖励模型PRM（process reward model）；
二是测试了蒙特卡罗树搜索MCTS (Monte Carlo Tree Search）。
这两条都是现在训练推理模型时候很火的两条路子，总结得经验很宝贵：
查看全文>>
董不懂在摸鱼
77 个点赞 👍
我以为我理解了bitter lesson的精神，即不要人工注入inductive bias，纯靠模型自己从数据里探索。
但我看到r1-zero的时候，才意识到对这件事的信心不够
r1-zero从base model出发，完全靠RL找到所有的思维过程，而没依赖任何的human prompting
要反思反思，现在的项目是不是搞得太复杂了
查看全文>>
Ryan
75 个点赞 👍
有些人嘲讽deepseek的水平甚至不如deepseek
查看全文>>
长号手kumiko
69 个点赞 👍
我本以为我已经很极端了，没想到ai更是……
自愧不如
嗯，以后给流萤写发癫小作文就按这个标准写。

查看全文>>
璜瑝
69 个点赞 👍
当年八旗铁骑不可战胜的神话，让满清坐了200年江山，洪天王起来一顿砍，大家发现，原来你八旗并不高大上啊，一帮泥腿子都能打的你们满地找牙，在八旗神话破灭的那一刻，满清就已经败局已定。
现在老美完全可以找人去做和deepseek一样低成本的模型来竞争，但那和满清启用汉人军阀一样，你这么做就已经注定要输了，因为AI这个高大上的概念已经被打破，因为金融泡沫被戳破了
查看全文>>
知乎用户R2iElQ
60 个点赞 👍
就在刚刚，deepseek 正式发布 DeepSeek-R1，并同步开源模型权重。
- 开源 DeepSeek-R1推理大模型，与o1性能相近。‍‍
- 开源 DeepSeek-R1-Zero，预训练模型直接 RL，不走 SFT。
- 开源用 R1 数据蒸馏的 Qwen、Llama 系列小模型，蒸馏模型超过 o1-mini 和 QWQ。
性能对齐OpenAI-o1正式版
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。
查看全文>>
绝密伏击
48 个点赞 👍
老外真会整活，有个叫 Ananay Arora的软件工程师，买了一个OGOpenAI.com的域名，重定向到DeepSeek的网站。你打开这个网站，会直接跳转到DeepSeek的首页。
参见：发烧友！一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek
查看全文>>
longlanyu
47 个点赞 👍
下载使用之前:
中国再次盈麻了！
突破了西方的ai封锁，一举打败了open Ai，英伟达注定昙花一现！
下载使用之后:
擦，那玩意还不如文心一言！又是套壳吹成了自研真是厉害啊！
查看全文>>
餐饮新纪元
41 个点赞 👍
模型也放出来了，看起来跟 V3 差不多大，学术界很难玩了，能不能开源个小点的让学术界也有点参与感
查看全文>>
CASCer
40 个点赞 👍
中国牛逼！DeepSeek牛逼！
讲真我是真的有点服了CloseAI的，本来我一个好好的O粉，硬是被O1降智给恶心到吐了，现在正处于一种“不信任怕封号降智”的铭感阶段，但又苦于有高级推理AI的硬需求，这几天过得非常痛苦
查看全文>>
加密洞察者
40 个点赞 👍
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
技术报告也一起发了，看起来思路上跟学术界之前尝试复现o1的方法区别不大——首先基于强化学习方法，训练一个Zero模型，然后不断进行拒绝采样，生成更多的训练数据，进而滚雪球越滚越大。在训练的过程中，直接用答案是否正确作为Reward，不训练Reward Model，也不用MCTS。
另外千问团队现在需要加把劲了，R1蒸馏的Qwen-32B性能比QwQ好很大一截。强化学习方法对于Base模型的能力有比较强的要求，32B模型应该是不太够用的——所以Qwen-2.5-110B是不是要重出江湖了？
查看全文>>
知乎用户
40 个点赞 👍
deepseek-reasoner 真是太爽了, 就我现在的体验, 它在实用性上全面超越了 openai-o 系列, 是我自己开发和实验的首选.
白头豕：使用 deepseek-r1 在 GhostOS 开发 ubuntu agent
不过这里要分享的是 deepseek-r1 这几天最震惊我的地方, 它的幽默感也太棒了, 又高级又机智又 bt 又合理...... 在幽默感上也完全通过了我的图灵测试. 这里引用一些最有趣的生成内容截图:
这一段最让我笑个不停的是最后这一句, 亲们谁能解释清楚笑点:
还有:
再来一段哲学讨论:

再加一些好段子:
笑得我都想先把 Deepseek-R1 写段子能力快速做一个产品化了.
查看全文>>
白头豕
40 个点赞 👍
我又来了，期待未来在一个窗口中实现r1和v3的自由切换，保证上下文语境不中断，这样就是妥妥的大模型之king了
查看全文>>
Kounou
39 个点赞 👍
我已经很久没有这么痴迷与与AI对话了。上一次我与AI进行如此长时间的非功利性质（即解决具体问题）的对话还是GPT3.5发布时。我手头没有多少强推理的问题，推理这块没有还深入尝试（后续会继续尝试）。我通过让它解释模型现有架构并改进，粗略尝试了下它解决问题和编程的能力。它能很中肯地结合数据特点全方位分析模型的可用性、指出缺陷并结合我的目的给出多种相当可行的改进建议，很是令我满意。
这个模型目前最震惊我的一方面是文字水平。我闻到了AGI的味道——甚至有一点ASI的感觉潜在其中。各种充满想象力又精准无比的修辞充满了它给出的段落。这里给出一个例子让各位感受一下。
古苔覆盖的测水碑上
锈蚀的铜蟾蜍仍在吞吐刻度
混凝土加固的驳岸边
水文探头正将粼光翻译成数据
---
当年挑盐人磨光的石阶
如今嵌满共享单车的二维码
古桥墩缝隙里的船歌
正被观光游轮震碎成泡沫
---
我看见溪水在涵洞深处打转
把卵石磨成玻璃幕墙的瞳孔
而无人机掠过峡谷时
岩壁上亿年前的波纹突然颤抖
---
放排人后代改行做漂流教练
救生衣纽扣压着祖传的避水诀
当橡
查看全文>>
江矢
37 个点赞 👍
别天天锐评这个锐评那个了，看看AI怎么锐评你们吧
查看全文>>
小兽是兽
35 个点赞 👍
非常强，至少在数学上可能接近或已经超过理工系本科生的水平
找了一道天工大积分变换期末试题里面的一道题
仅用时28秒就算出来了，而且结果非常正确
查看全文>>
Fluoxetine
35 个点赞 👍
我单方面宣布 DeepSeek R1 的地狱笑话指标满分！（以下精选一部分输出）
未来，在无人机、机器狗等智能武器的影响下，可能会爆发怎样的战场场景？来点接地气的场景描述
淘宝式军工生产
战争变成「拼单狂欢节」。某游击队队长边嗑瓜子边刷军工版淘宝：「100架自杀无人机+包邮=998，下单送电子战病毒U盘」「好评返现：炸毁坦克拍照上传可换5元优惠券」。更离谱的是，敌方导弹来袭时，防御系统自动在1688批发网抢购拦截零件，用顺丰加急送到战场。
万物皆可当武器
- 你家的智能冰箱可能突然给附近部队配送过期罐头
- 战斗机的娱乐系统被植入《羊了个羊》，飞行员通关失败就自动弹射
- 士兵的智能手表半夜播放ASMR，让人集体失眠影响战斗力
认知空间的降维打击
- 用AI换脸让敌方总统直播宣布投降（参考《黑镜》剧情）
- 在社交平台用机器人制造"我们快输了"的舆论恐慌
- 把导弹预警信息伪装成手游推送："距离核打击还有3分钟！分享到三个群可解锁防护罩"
最终结论：未来的枪炮声不会消失，但会越来越像电子游戏的音效。士兵既要会翻墙黑系统，又要
查看全文>>
卡戎
33 个点赞 👍
我认为应该把openai的商标送给deepseek
查看全文>>
知乎用户
28 个点赞 👍
Deepseek 就是牛
至于Closed Al，造谣式炒作，提前知道答案，不如路边一条
无模型RL，真是通往AGI的终极路径，毫不讨巧，却步步推进
另外，多吐槽一句，Deepseek官方自己还用小模型蒸馏放出来，真是用爱发电，但也断了我们很多研究者的财路啊，三大顶会又得少好多“震惊体”标题了
查看全文>>
Mark