今天分享的是一种检索增强推理方法:RARE。


01
简介

02
框架


02
框架

基于 MCTS:rStar 利用 MCTS 算法来探索不同的推理路径,并选择最优路径。MCTS 是一种用于复杂决策过程的决策算法,例如游戏。它通过构建搜索树并模拟结果来估计潜在行动的价值。MCTS 主要包含四个阶段: 选择:从根节点开始,根据 UCT 等策略遍历子节点,直到达到叶节点。 扩展:在叶节点,如果它不表示终端状态,则添加一个或多个可行子节点,以表示潜在的后续行动。 模拟(评估):从新添加的节点之一开始,通过随机选择行动直到达到终端状态,从而估计节点的潜在价值,进行随机模拟。 反向传播:模拟完成后,结果(胜利、失败或平局)通过遍历的节点传播回溯,更新统计数据(如奖励或访问次数),以指导未来的决策。 推理行动:rStar 引入了五种推理行动,包括: A1:提出一步思维:根据前一步骤生成下一个推理步骤。 A2:提出剩余的思考步骤:一次性生成所有剩余的推理步骤。 A3:生成下一个子问题并回答:将问题分解为子问题,逐一解决。 A4:重新回答子问题:重新回答之前生成的子问题,以提高准确性。 A5:重新表述问题/子问题:重新表述问题或子问题,以澄清条件和减少误解。
A6:搜索查询生成和信息检索:根据初始问题生成搜索查询,并进行信息检索,将检索到的文档作为上下文,以丰富推理轨迹并支持生成更全面和相关的最终答案。其过程如下图所示: 
A7:子问题检索和重新回答:针对通过操作 A3 生成的子问题进行细化,为每个子问题检索特定信息,并使用检索到的信息重新回答子问题,从而提高中间推理步骤的准确性,并确保整个推理轨迹的一致性和事实可靠性。其过程如下图所示: 

4. 使用检索信息进行评分(Rate using retrieved information):每个语句都与检索到的证据进行比较,并根据其与信息的对齐程度标记为“支持”或“不支持”。推理路径的整体事实得分是支持语句的比例,表示轨迹的事实可靠性。

03
总结

03
总结
RARE方法为了应对复杂的知识密集型任务中的推理挑战,首先在rStar生成器中引入了两项创新的检索增强操作,使模型能够实时集成上下文相关的信息,从而提升推理的准确性和相关性。随后,提出了检索增强事实评分器(RAFS),用于评估和排序推理路径,确保在推理过程中保持逻辑一致性和事实的可靠性。这些创新显著提升了大语言模型(LLMs)在医学和常识问答等任务中的推理精度和事实完整性,尤其在处理需要多步推理和领域特定知识的复杂任务时,表现出显著的性能提升。
文章转载自AI 搜索引擎,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




