秒回感明显了:写代码、生成文档时,响应速度肉眼可见提升,官方说的 10~20% 加速保守了,复杂指令(比如生成一个 Flask 后端带 JWT 验证)几乎不用等,结果就蹦出来了。
代码更懂上下文:处理长代码文件时(实测 80K tokens 的工程目录),让它新增功能或修 Bug,它能精准定位相关模块,不会像以前偶尔“跑偏”去改无关文件。生成 Python 代码时,import 包和类型提示(Type Hints)更合理,少了很多野生写法。
写万字长文也不跑题了: 为了测试,我让它写一篇《从 MoE 架构看大模型进化》的科普文(约 1.2 万字)。最大惊喜是从开头定义到中间技术对比再到结尾趋势预测,论点始终紧扣主线,没有中途去讲无关知识。段落过渡自然,像人一样一气呵成。
不再是记忆金鱼了:在超长对话中(测试聊了 50+ 轮),问它之前提到的某个设定细节(比如小说里主角的猫叫什么),秒答正确,不再需要多次提醒。
实测槽点:
物理/超硬核数学仍有提升空间:解一道涉及广相张量计算的题目时,中间某步符号推导会出现偏差(虽然最终答案接近)。
幽默感还是不行:让它写段子,依然有“理科生硬挠你痒”的既视感,这点还是没变。。。