我新的论文就是用思维链来提升情感分析应用,因为我的研究方向并不是深度学习,而是社科,所以审稿人都比较外行。
但是外行问的问题可能是有价值的,比如其中一个审稿人问到,CoT这么强,那它是如何实现的呢?
鬼才知道。。。
前段时间有个很强势的说法是它增加了token,所以就变强了。但这个论点有个问题,不同的提问方式,甚至同一种提问方式,能衍生出来的推理过程都不同,它是随机的,增加token也是随机的,并不是增加的越多,它就能提升大模型解决问题的能力。而是要锁定它增加token的方向,或者不增加方向对了,也能提升解决问题的概率。
如果AI真的是在模拟人,那么人的思维方式是很有欺骗性甚至是欺诈性的,以弱胜强,以小博大,以龟赛兔,通过骗人来把问题解决都是人的标志性事件。所以增加算力和重建思维方式,甚至是欺骗性推理,都有可能导致解决问题的可能性提升。
但是,将Deepseek作为冲击全球算力的标志,我认为为时尚早,它只能证明一点,人们还没有搞明白最基础的大模型的机制。
更重要的是对底层机制的探索重要性,