行业大模型是通用大模型能力不足时的阶段性产物吗？ - 行业大模型：比如金融、智能驾驶、医疗、代...

行业大模型：比如金融、智能驾驶、医疗、代码助手、工业方面等；

通用大模型那既能做事也能写诗，所以我认为嘲讽不会写诗，只会做事恰恰说明模型通用能力不足的体现，相当于只训练在垂直域能力。

现在国内发布的大模型一般为一个模型系列，而非真正意义上的一个大模型，强如gpt4都被爆出来多个基模型采用MOE架构，路由层分发输入，实际测试运行的是其中2-3个基模型。大模型通用能力在chatgpt就被证实，在某些物理化学或计算领域存在缺陷，但行业方方面面，最重要的还是模型的通用能力尽可能强，例如chatgpt我认为还是很强，国内的大模型依旧存在差距，还是将chatgpt作为竞争对象。

编辑于 2023-07-20 13:41・IP 属地上海