暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

LoT: 将逻辑框架注入大语言模型以提高推理能力

AI 搜索引擎 2024-11-13
951

今天分享的是中科大发布的一篇工作。

题目是Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models. 

思维逻辑:为大型语言模型注入逻辑以实现全面推理

文章链接: https://arxiv.org/pdf/2409.17539

摘要

虽然大语言模型在各种任务中表现出色,但在处理复杂逻辑推理时,它们的表现仍然存在不足。传统的推理方法,如Chain-of-Thought(思维链),虽然能在一定程度上提升推理能力,但推理过程和最终得出的结论可能不一致,导致结果不可靠。。

为了解决这个问题,近期有研究提出了Logic-of-Thought (LoT)方法,通过引入命题逻辑来生成扩展的逻辑信息,并将其作为额外的提示信息与原始输入结合,从而增强模型的推理能力。与现有的提示方法兼容,LoT方法可以与Chain-of-Thought等现有技术无缝结合,进一步提升模型的推理表现。

实验结果显示,LoT方法在多个逻辑推理任务中都取得了显著进展。例如,LoT在ReClor数据集上提升了Chain-of-Thought的表现4.35%;在LogiQA上,LoT让Chain-of-Thought with Self-Consistency的表现提高了5%;在ProofWriter数据集上,LoT提高了Tree-of-Thoughts的表现8%。

通过Logic-of-Thought提示方法,研究人员成功增强了LLM的逻辑推理能力,为复杂问题的处理提供了新的思路和技术支持。

主要方法

作者在LoT方法中定义了如下三个概念:

1. 命题(Propositions)

命题是指那些具有明确真值特征的声明性句子,并且命题不能同时为真和为假。在逻辑推理中,命题是构建逻辑表达式的基本元素。文中使用大写字母(如A、B、C)来表示具体的命题,举例来说,“你有键盘打字技能”就是一个命题;而小写字母(如p、q、r)则用来表示任何命题。

2. 连接词(Connectives)

连接词是作用于命题的运算符,它们可以对单一命题进行操作,或者将多个命题连接起来,形成新的逻辑表达式。常用的连接词包括:

  • ¬表示取反操作,意为“非”或“否定”。例如,¬p表示“p的否定”。

  • 表示蕴含,即如果前一个命题为真,则后一个命题为真(“如果p,则q”)。例如,p → q表示“p是q的充分条件”。

  • 表示合取,即只有当两个命题都为真时,整个表达式才为真。例如,p ∧ q表示“p和q都为真”。

3. 逻辑推理法则(Logical reasoning laws)

逻辑推理法则是两个逻辑表达式之间推导关系的定义。常用的符号包括:

  • :表示某个逻辑表达式可以推导出另一个逻辑表达式。

  • :表示两个逻辑表达式可以互相推导。

文章中提到三条基本的逻辑推理法则:

  • 双重否定法则(Double Negation Law)¬¬p ⇔ p,表示两次取反等于原命题本身。例如,“非非p”与p是等价的。
  • 对换法则(Contraposition Law)(p → q) ⇔ (¬q → ¬p),表示“如果p蕴含q”,则等价于“非q蕴含非p”。
  • 传递法则(Transitive Law)(p → q) ∧ (q → r) ⇒ (p → r),表示如果p蕴含q,且q蕴含r,那么p也必然蕴含r。

LoT方法主要分为以下三个阶段:

1. 逻辑提取阶段(Logic Extraction)

首先,LoT方法指示LLM从输入文本中挑选出包含条件推理关系的句子,提取出具有逻辑含义的语句集合。接着,模型会识别和标记文本中的命题符号,并根据命题之间的逻辑关系,使用符号(如否定符号“¬”或蕴含符号“→”)进行表示。例如,模型从不同的句子中提取出“能够使用计算机”这一相同意思的描述,并将其统一表示为符号B。通过进一步分析,得到新的逻辑表达式¬A → ¬B

2. 逻辑扩展阶段(Logic Extension)

在逻辑扩展阶段,LoT利用Python程序结合基本的逻辑推理法则(如传递法则对换法则),对提取出的逻辑表达式进行推导和扩展。例如,通过推导,¬A → ¬B¬B → ¬C可以推导出新的表达式C → A。这一阶段的目的是通过逻辑推理,生成更复杂的逻辑关系,为后续阶段提供更加丰富的信息。

3. 逻辑翻译阶段(Logic Translation)

最后,LoT方法将扩展后的逻辑表达式转化为自然语言描述,并将这些描述与原始输入结合,形成一个增强的输入提示。这一过程通过将命题符号(如C和A)与其自然语言描述(例如“能够使用文字处理程序写作业”和“具备键盘打字技能”)相结合,避免了信息丢失,同时增强了输入的逻辑信息。例如,逻辑表达式C → A被翻译为“如果具备键盘打字技能,那么能够使用文字处理程序写作业”,并作为新的提示信息加入原始输入中。

通过这三个阶段,LoT方法不仅提升了语言模型的逻辑推理能力,还有效避免了信息丢失,为模型提供了更准确、更丰富的推理支持。

逻辑推理框架实例解析

为了更好地理解LoT的流程,我们通过示意图的例子来详细解析整个过程。

1. 原始输入

背景信息(Context):

  • “如果你没有键盘技能,你将无法使用电脑。”

  • “并且如果你不能使用电脑,你就不能用文字处理程序写论文。”

问题(Question):

  • “如果上述陈述为真,以下哪一项也必须为真?”

选项(Options):

  • A. 如果你不能用文字处理程序写论文,那么你没有键盘技能。

  • B. 如果你能用文字处理程序写论文,那么你至少有一些键盘技能。

  • C. 如果你不能用文字处理程序写论文,那么你不能使用电脑。

  • D. 如果你有一些键盘技能,你就能用文字处理程序写论文。

2. 逻辑提取

逻辑提取阶段,我们使用LLM从给定的背景信息中提取出核心命题和它们之间的逻辑联系。具体步骤如下:

  1. 提取命题

    • 命题1:如果你没有键盘技能(记作P),你将无法使用电脑(记作Q)。即
    • 命题2:如果你不能使用电脑(Q),你就不能用文字处理程序写论文(记作R)。即
  2. 符号化表示

3. 逻辑扩展

逻辑扩展阶段,我们应用逻辑推理原则来推导新的逻辑表达式。具体步骤如下:
  1. 逆否命题
    • 根据命题1 ,其逆否命题为
    • 根据命题2 ,其逆否命题为
  2. 连锁推理
    • 结合起来,可以得到
    • 即:如果你不能用文字处理程序写论文(),那么你没有键盘技能()。
  3. 等价转换
    • 的等价形式为
    • 即:如果你有键盘技能(P),那么你可以用文字处理程序写论文(R)。
  4. 逆否命题
    • 的逆否命题为
    • 即:如果你不能用文字处理程序写论文(),那么你没有键盘技能()。
  5. 最终结论
    • 可以推出
    • 即:如果你能用文字处理程序写论文(R),那么你至少有一些键盘技能(P)。

4. 逻辑翻译

逻辑翻译阶段,我们将上述逻辑表达式转换为自然语言描述,使其更加直观易懂。具体步骤如下:
  1. 翻译结论
  2. 我们的最终结论是:如果你能用文字处理程序写论文(R),那么你至少有一些键盘技能(P)。
  3. 对应选项
  4. 这一结论对应于选项B:“如果你能用文字处理程序写论文,那么你至少有一些键盘技能。”

总结

当前的LoT方法支持的连接词和逻辑推理法则还比较有限。如果要增加更多的连接词和推理法则,就意味着在逻辑提取和翻译阶段,提示设计会变得更加复杂,同时逻辑推导的难度也会增加。

另外,LoT依赖LLM进行逻辑符号和表达式的提取,但LLM固有的幻觉问题仍然是一个挑战。具体来说,LLM可能会导致推理中的表达式重复、遗漏重要的逻辑关系,甚至在逻辑表达式上出现偏差。因此,如何进一步提升LLMs在逻辑提取过程中的准确性,避免这些幻觉问题,将是LoT方法未来改进的关键。

编者简介

李剑楠:华东师范大学硕士研究生,研究方向为向量检索。作为核心研发工程师参与向量数据库、RAG等产品的研发。代表公司参加DTCC、WAIM等会议进行主题分享。

文章转载自AI 搜索引擎,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论