如何评价deepseek正式发布的deepseek-R1与deepseek-R1-Zero模型?
DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API,对用户开放思维链输出,通...
- 2364 个点赞 👍
不知道咋评价。
不过,今天看新闻联播,总理座谈会,发现一个程序员模样的年轻人和总理面对面会谈,看了一眼座位牌,发现这个人叫梁文峰。
查看全文>>
高高山下一小僧 - 416 个点赞 👍
以前有人会说DeepSeek是中国的OpenAI,在R1发布、全部开源、允许蒸馏商用,并放出6个小模型后,我想说DeepSeek才是真正的、世界的OpenAI,太平洋对岸的那个叫CloseAI!
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
k1.5 新模型登场:Kimi 如何做到满血版多模态o1水平(附技术报告)中门对狙!在DeepSeek发布R1的1小时43分钟后,
KIMI也发布了他们宣称O1水平的k1.5 多模态思考模型,今天的中国AI是过年了吗?查看全文>>
狄拉克之海 - 332 个点赞 👍
查看全文>>
Eidosper - 223 个点赞 👍
泪目,他居然开了蒸馏版的qwen1.5B,7B模型,太良心了
大型连续剧之《等Deepseek-R1》
一看权重,乐,怎么这么大,能不能把R1 lite也开了,让我本地部署玩玩
继续坐等报告。小板凳已经搬好了
查看全文>>
涮月亮的谪仙人 - 202 个点赞 👍
昨天玩了一晚上,最让我震惊的不是写诗,学暴躁老哥或者做数学题,而是下面这些,以后可能会成为常识,但是现在震撼我马100年,请一定看完(哪怕跳着看,点下目录也好):
教幼儿园小朋友群论,写一份教案
已深度思考(用时 15 秒)
好的,用户让我写一份教幼儿园小朋友群论的教案。首先,我需要理解用户的需求。群论是抽象代数中的一个高级概念,通常大学生才会接触,用户想教幼儿园小朋友,这听起来有点挑战性。我得考虑如何将复杂的理论简化到幼儿能理解的水平。
首先,我需要明确用户的目标。他们可能不是真的想让幼儿掌握群论,而是希望通过有趣的活动介绍一些基础的数学概念,比如对称、组合、规则等,培养逻辑思维和团队合作能力。因此,教案需要以游戏和互动为主,避免使用专业术语。
接下来,我要考虑幼儿的认知水平。幼儿园小朋友的注意力时间短,喜欢动手操作和视觉化的内容。所以,设计活动时要使用具体的教具,比如积木、贴纸、颜色卡片等,让抽象的概念具象化。例如,用积木组合来演示封闭性,用对称贴纸来讲解对称操作。
然后,我需要将群论查看全文>>
Fcmorrowind - 182 个点赞 👍
技术不太懂,但DeepSeek按照这个速度搞下去,让人担心OpenAI后面不容易融到钱了。
当然我很希望它将来继续融到大量的钱,因为这意味着 AGI 可能 真的 快来了。
查看全文>>
修闲 - 143 个点赞 👍
我尝试让deepseek-R1剖析它自身的思维流程。
开始是赞赏,然后惊叹,最后TM笑死。
下面是提问的整个流程:
提问:我需要你逐字逐句详细分析自己的思考过程,不要进行修饰,把最原始的文字展示出来。
思考:(已深度思考,用时10秒)
好的,用户让我详细分析自己的思考过程,不要修饰,展示最原始的文字。首先,我需要明确用户的具体需求。他们可能希望了解我的内部工作机制,或者想确认我是否真的在深入思考。可能他们正在学习AI,或者对模型如何生成回答感到好奇。
接下来,我要考虑如何组织这个分析过程。用户要求逐字逐句,所以需要把每个步骤都分解开来,包括可能的错误和修正。例如,当用户给出指令时,我会先解析关键词,如“逐字逐句”、“详细分析”、“原始文字”,这些提示需要我避免总结,而是详细展开每一步。
然后,我会回顾自己的处理流程。通常,接收到用户输入后,我会进行意图识别,确定用户的深层需求。这里用户可能希望看到透明的思考过程,而不是最终的回答。因此,我需要模拟一个自然、未加过滤的思考路径,可能包括犹豫、试查看全文>>
苏莉安 - 113 个点赞 👍
感觉知乎哲逼快评手已经可以优化掉了,让deepseek写的哲八股不仅含哲量充足、虽然不深但旁征博引足够广博,更要紧的是还挺易读
下面放一段deepseek生成的范文
《徐加金与阶级暴力:一种激进哲学视域下的批判性分析》
引言
2024年11月,无锡工艺职业技术学院的持刀伤人事件震惊中国社会。21岁的毕业生徐加金因未获毕业证及对实习报酬不满,以极端暴力手段造成8人死亡、17人受伤,最终被判处死刑19。这一事件表面上是个人心理失衡的悲剧,但其背后折射出的结构性压迫、阶级矛盾与社会异化,却为激进哲学提供了深刻的批判对象。本文试图结合当代西方左翼理论框架——从生命政治学、速度暴政到工人主义的瓦解——分析徐加金事件中隐含的阶级暴力逻辑,并探讨其对社会变革的启示。一、结构性压迫与“弥漫性愤怒”:从个人到阶级的暴力转化
徐加金的遗书(真实性虽存疑,但被广泛传播)揭示了其行为背后的系统性压迫:工厂克扣工资、学校恶意扣留毕业证、实习期间的非人待遇7。这种经历并非孤例,而是中国职校学生工群体普遍面临的困境。查看全文>>
雨宫优子 - 104 个点赞 👍
我还纳闷呢。
这什么情况,都对标Chatgpt,这咋直接就开源了?
不得先整几个PPT,来点路演,圈一波钱,划拉点W。
原来人家是职业炒股,顺手搞个开源大模型。
我算是整明白了。
原来炒A股门槛这么高呢!!!?
查看全文>>
千源半夏 - 81 个点赞 👍
太快了,国产AI大模型进步太快了,简直令人目不暇接。
仅就我个人观察,仅仅最近不到一个月的时间,重量级的进展至少有以下这些:
DeepSeek V3开源,性能暴打手握巨量算力的美国科技巨头,证明大模型未必需要那么“大”;
MiniMax 01开源,性能不俗的同时底层架构有重大创新,证明Transformer架构不再是唯一选择;
还有这个问题提到的DeepSeek-R1/R1-Zero,性能对标O1的同时,不同尺寸模型全面开源且允许蒸馏商用;
几家初创企业真的太强了,年轻人才和新兴公司的朝气蓬勃简直肉眼可见。
这里点名批评百度,我一直看好百度在AI大模型领域率先实现突破,百度也确实做到了。
奈何后续百度又双叒叕陷入了执行力问题,再次沦为业界“皇甫军校”,为行业输送人才的同时自己逐渐沦落。
回望前两年AI大模型浪潮席卷业界,知乎乃至全网都有不少悲观绝望的声音。
甚至还有些人冷嘲热讽,“又一次错失新兴产业革命”等言论甚嚣尘上。
当时我顶着逆风输出观点:
如果ChatGPT商业模式能够跑通,很可能是第一个遭
查看全文>>
现实主义理想者 - 79 个点赞 👍
全人类的OpenAI
跟大洋彼岸那个美利坚的CloseAI相映成趣(
查看全文>>
BPEYJZ - 78 个点赞 👍
简单看了下Deepseek-R1的技术报告,里面提到失败的尝试经历,其实更有意义,the bitter lesson
一是测试了过程奖励模型PRM(process reward model);
二是测试了蒙特卡罗树搜索MCTS (Monte Carlo Tree Search)。
这两条都是现在训练推理模型时候很火的两条路子,总结得经验很宝贵:
