有可能模型本身很小,或者模型本身有很多out,大部分的token可以在小模型对应的out出结果,只有少部分token需要跑完比较大的模型。 发布于 2024-03-29 17:21・IP 属地北京 赞同添加评论分享 收藏喜欢