5个回答

行业大模型是通用大模型能力不足时的阶段性产物吗?

知乎科技

行业大模型:比如金融、智能驾驶、医疗、代码助手、工业方面等;

通用大模型那既能做事也能写诗,所以我认为嘲讽不会写诗,只会做事恰恰说明模型通用能力不足的体现,相当于只训练在垂直域能力。

现在国内发布的大模型一般为一个模型系列,而非真正意义上的一个大模型,强如gpt4都被爆出来多个基模型采用MOE架构,路由层分发输入,实际测试运行的是其中2-3个基模型。大模型通用能力在chatgpt就被证实,在某些物理化学或计算领域存在缺陷,但行业方方面面,最重要的还是模型的通用能力尽可能强,例如chatgpt我认为还是很强,国内的大模型依旧存在差距,还是将chatgpt作为竞争对象。

编辑于 2023-07-20 13:41・IP 属地上海
xiansheng
自由评论 (0)
分享
Copyright © 2022 GreatFire.org