DeepSeek V3开源意味着大模型走出需要巨资开路的尴尬困境。旁观者可以入场了,当然兴奋,朱啸虎一反常态拥抱大模型了,印度阿三也将有自己的大模型了。
幻觉问题通过多学习,多思考就能解决。真正的难题是它不能持续学习,随时主动学习。一次性大批量学习的架构导致了灾难性遗忘和幻觉问题,以及单次学习成本依然很高的问题。最终导致很难在真实世界中成长。
发布于 2025-02-11 17:12・IP 属地四川
DeepSeek V3开源意味着大模型走出需要巨资开路的尴尬困境。旁观者可以入场了,当然兴奋,朱啸虎一反常态拥抱大模型了,印度阿三也将有自己的大模型了。
幻觉问题通过多学习,多思考就能解决。真正的难题是它不能持续学习,随时主动学习。一次性大批量学习的架构导致了灾难性遗忘和幻觉问题,以及单次学习成本依然很高的问题。最终导致很难在真实世界中成长。