14个回答

为什么 LLM 仅预测下一词,就能「涌现」出高级能力?

tomsheep

你在一百个样本里训练

第10个就涌现了,因为数据集分布被找到了

你在一千万亿样本里训练

一百万亿时候,数据分布也被覆盖了

这个时候

就“涌现”了

涌现是一个跳大神说法

你又不负责拉投资

是个正经人

没必要扯这个

不体面

摆渡
自由评论 (0)
分享
Copyright © 2022 GreatFire.org