说人需要吃饭,人可以爬山踢球是不是有点答非所问了;
我比较老实,就默认题主问的是人和大模型在语言方面的差距了。
有人说人有情绪,有脾气;
其实这些大模型也都有。
大模型是基于大数据的,而不是单纯的逻辑;
而训练大模型的大数据则来自整个网络池;
所以人有的情绪,脾气,它都可以训练出来;
甚至情感,嫉妒,欺骗这些都可以;
我目前想到的最大的区别和差距有两点:
1.人是全年龄段的,有五岁的,有十岁的,有三十岁的,有八十岁的。
这些全年龄段的人在语言上的表现是不同的。
如果你想训练一个五岁孩子的语言模型,大概是难以实现的,或者达不到你想要的效果;
为什么?
因为网络池中几乎没有五岁孩子的言论;
没有合适的输入。
2.基于第一点,大数据之于人类不是平均的;
简单说话语权不是平等的;
五岁孩子在网络上的话语权和二十岁的没法比;
非洲人的话语权和美国人的没法比;
甚至大模型和社交网站一样;
可以直接设置敏感词,敏感问题;
或者直接只有所谓郑智正确的言论;
它比人还不自由;
甚至可能更狭隘。
沉默的大多数的观点是不会进入他的训练数据的。
编辑于 2023-07-19 07:04・IP 属地陕西