蜗蜗助手
让 AI 更懂你

“思维树(Tree of Thoughts)”与“思维链(Chain-of-Thought)”相比,在解决哪些类型的问题上更有优势?

我们先聊聊“思维链(Chain-of-Thought)”。这个方法很简单,就是让AI在回答问题前,先把思考步骤一步步写出来。 就像你解一道数学题,不会直接写答案,而是会先把公式和计算过程列出来。这样做的好处是,AI不容易在复杂的逻辑里绕晕,而且我们也能看到它的思考过程,知道它错在哪儿。 对于那些有清晰、线性解决路径的问题,比如“莎拉有3件20美元的衬衫和2条50美元的牛仔裤,总共打九折,她花了多少钱?”,思维链就很好用。 它会先算衬衫总价,再算牛仔裤总价,然后加起来,最后打折,步骤清晰,不容易出错。

但是,思维链有一个根本性的问题:它是一条直线。它只能沿着一个方向走到黑。 如果第一步就想错了,那后面基本就全错了,而且它自己还不知道回头。 这就像走一条单行道,发现是死胡同的时候,已经没法掉头了。此外,研究发现,思维链对模型的规模有要求,通常需要百亿参数以上的大模型才能看到明显效果,小模型用了反而可能产生不合逻辑的推理,导致准确率下降。

这就是“思维树(Tree of Thoughts)”出场的时候了。如果说思维链是走一条单行道,那思维树就是在走一个迷宫,它会在每个路口都派出探子去看看不同的路。 它不是沿着单一路径思考,而是在每一步都生成多个不同的“想法”或下一步的可能性,然后评估哪个想法最有前途,再继续深入。 这个过程就像一棵树,从一个树干(问题)开始,分出好几个大树枝(初步想法),每个大树枝又会分出更多小树枝(深化想法)。

这种方法的关键在于它引入了探索和评估机制。 AI不再是“一条路走到黑”的死脑筋,它学会了“货比三家”。它会自己判断哪些想法看起来不靠谱,然后剪掉那些“枯枝”,集中精力去培养那些最有希望长出果实的树枝。 如果发现一条路走不通,它还能退回到上一个分叉口,选择另一条路继续探索。 这种回溯和探索的能力,让它在解决特定类型的问题时,比思维链强得多。

那么,具体是哪些类型的问题呢?

第一类:需要广泛探索和战略规划的问题。

这类问题的特点是没有唯一的正确路径,需要尝试多种可能性才能找到最优解。典型的例子就是“24点游戏”。 规则很简单,用四个数字通过加减乘除得到24。

用思维链来解这个问题,效果非常差。它可能会随便选两个数做个运算,然后用结果和第三个数继续运算,这是一条线走下去的。如果初始的运算顺序或方式不对,就很难得到24。有研究显示,GPT-4用思维链提示解决24点游戏的成功率只有4%。

但思维树完全不同。它会把所有可能的运算组合都当成不同的“树枝”来探索。 比如,对于“4 9 10 13”这四个数,思维树会同时探索:
* 分支A:先算 9 + 13 = 22,然后看 22、10、4 怎么组合。
* 分支B:先算 10 * 4 = 40,然后看 40、9、13 怎么组合。
* 分支C:先算 13 – 9 = 4,然后看 4、10、4 怎么组合。

在探索每个分支时,它还会进行评估。比如分支B得到40,它可能会判断这个数字离24有点远,成功的可能性不大,于是降低这个分支的优先级。而分支C得到了两个4,它可能会觉得“4x(10-4)=24”这条路很有希望,于是投入更多资源去深化这个想法。 通过这种方式,思维树系统地探索了各种可能性,而不是盲目地撞大运。结果是,用思维树的方法,GPT-4解决24点游戏的成功率飙升到了74%。

类似的问题还有数独或填字游戏。 当你在一个格子里填入一个数字或字母时,这会影响到其他所有行列的可能选择。思维链式的思考只会让你一条道走到黑,很容易就陷入逻辑死胡同。而思维树则可以在一个格子里“试填”一个答案,然后推演下去,如果发现矛盾,它能立刻“回溯”到上一步,换一个答案再试。 这本质上是一种有策略的试错,非常接近人类解决这类谜题时的思考方式。

第二类:需要创造力和多方案构思的任务。

比如创意写作。 假设你让AI根据四个随机的句子写一个四段式的连贯故事。

用思维链,AI可能会直接把四个句子串起来,然后往下编。这种方式写出来的故事,情节可能很平淡,或者逻辑上很生硬。因为它从一开始就锁定了一个故事走向。

而思维树会把这个问题看作一个开放的创作过程。它会在写完第一段后,构思几种完全不同的情节发展方向作为不同的“分支”:
* 分支A:主角发现了一个古老的秘密。
* 分支B:主角遇到了一个神秘的陌生人。
* 分支C:情节发生反转,之前的一切都是个误会。

然后,AI会评估哪个分支更有戏剧性、更符合逻辑、更有趣。它可能会选择B分支,然后基于“遇到陌生人”这个情节,再构思接下来几段的多种可能性。 这种方法让AI的写作过程不再是线性的,而是充满了选择和优化,最终生成的文本在连贯性和创造性上都会好很多。

第三类:存在多种约束条件、需要权衡和决策的复杂问题。

这类问题在商业策略、行程规划或资源分配等现实场景中非常常见。比如,制定一个公司的五年发展战略。

思维链可能会给你一个看起来不错的方案,比如“第一年开拓市场,第二年增加研发,第三年……” 这个方案可能逻辑自洽,但它只是众多可能性中的一种。

思维树则会更像一个真正的战略顾问。它会把不同的战略方向作为顶级分支,比如:
* 分支A:积极扩张,进入新市场。
* 分支B:保守运营,专注于优化现有业务。
* 分支C:技术突破,开发颠覆性产品。

在每个分支下,它又会进一步分解出子任务和可能的风险,并对每个分支的潜在回报和成功率进行评估。 比如,在“积极扩张”的分支下,它会考虑进入哪个市场、面临的竞争、需要的资金等。通过这种系统性的分析,思维树能够提供一个更加全面、考虑更周全的决策参考,而不是一个单一的、未经比较的答案。

当然,思维树也不是万能的。它的最大缺点就是计算成本高。 因为要探索那么多条路径,它需要消耗更多的计算资源和时间。 对于那些简单、直接的问题,用思维树就像杀鸡用牛刀,不仅浪费,而且可能因为想得太多而把简单问题复杂化。 在这种情况下,高效直接的思维链反而更好。

所以,选择哪种方法,完全取决于你要解决的问题类型。 如果问题有标准答案,步骤清晰,比如大多数数学计算和事实问答,思维链简单高效,是更好的选择。但如果问题是开放性的,需要探索、规划、创造和权衡多种可能,那么思维树的优势就体现出来了。它通过模仿人类在面对复杂问题时的“深思熟虑”——即生成多种选项、评估优劣、在必要时回溯和调整——极大地拓展了AI解决复杂问题的能力边界。

赞(0)
未经允许不得转载:蜗蜗助手 » “思维树(Tree of Thoughts)”与“思维链(Chain-of-Thought)”相比,在解决哪些类型的问题上更有优势?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册