LoT: 将逻辑框架注入大语言模型以提高推理能力

AI 搜索引擎 2024-11-13

967

今天分享的是中科大发布的一篇工作。

题目是Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models.

思维逻辑：为大型语言模型注入逻辑以实现全面推理

文章链接: https://arxiv.org/pdf/2409.17539

摘要

虽然大语言模型在各种任务中表现出色，但在处理复杂逻辑推理时，它们的表现仍然存在不足。传统的推理方法，如Chain-of-Thought（思维链），虽然能在一定程度上提升推理能力，但推理过程和最终得出的结论可能不一致，导致结果不可靠。。

为了解决这个问题，近期有研究提出了Logic-of-Thought (LoT)方法，通过引入命题逻辑来生成扩展的逻辑信息，并将其作为额外的提示信息与原始输入结合，从而增强模型的推理能力。与现有的提示方法兼容，LoT方法可以与Chain-of-Thought等现有技术无缝结合，进一步提升模型的推理表现。

实验结果显示，LoT方法在多个逻辑推理任务中都取得了显著进展。例如，LoT在ReClor数据集上提升了Chain-of-Thought的表现4.35%；在LogiQA上，LoT让Chain-of-Thought with Self-Consistency的表现提高了5%；在ProofWriter数据集上，LoT提高了Tree-of-Thoughts的表现8%。

通过Logic-of-Thought提示方法，研究人员成功增强了LLM的逻辑推理能力，为复杂问题的处理提供了新的思路和技术支持。

主要方法

作者在LoT方法中定义了如下三个概念:

1. 命题（Propositions）

命题是指那些具有明确真值特征的声明性句子，并且命题不能同时为真和为假。在逻辑推理中，命题是构建逻辑表达式的基本元素。文中使用大写字母（如A、B、C）来表示具体的命题，举例来说，“你有键盘打字技能”就是一个命题；而小写字母（如p、q、r）则用来表示任何命题。

2. 连接词（Connectives）

连接词是作用于命题的运算符，它们可以对单一命题进行操作，或者将多个命题连接起来，形成新的逻辑表达式。常用的连接词包括：

¬：表示取反操作，意为“非”或“否定”。例如，¬p表示“p的否定”。
→：表示蕴含，即如果前一个命题为真，则后一个命题为真（“如果p，则q”）。例如，p → q表示“p是q的充分条件”。
∧：表示合取，即只有当两个命题都为真时，整个表达式才为真。例如，p ∧ q表示“p和q都为真”。

3. 逻辑推理法则（Logical reasoning laws）

逻辑推理法则是两个逻辑表达式之间推导关系的定义。常用的符号包括：

⇒：表示某个逻辑表达式可以推导出另一个逻辑表达式。
⇔：表示两个逻辑表达式可以互相推导。

文章中提到三条基本的逻辑推理法则：

双重否定法则（Double Negation Law）：¬¬p ⇔ p，表示两次取反等于原命题本身。例如，“非非p”与p是等价的。
对换法则（Contraposition Law）：(p → q) ⇔ (¬q → ¬p)，表示“如果p蕴含q”，则等价于“非q蕴含非p”。
传递法则（Transitive Law）：(p → q) ∧ (q → r) ⇒ (p → r)，表示如果p蕴含q，且q蕴含r，那么p也必然蕴含r。

LoT方法主要分为以下三个阶段:

1. 逻辑提取阶段（Logic Extraction）

首先，LoT方法指示LLM从输入文本中挑选出包含条件推理关系的句子，提取出具有逻辑含义的语句集合。接着，模型会识别和标记文本中的命题符号，并根据命题之间的逻辑关系，使用符号（如否定符号“¬”或蕴含符号“→”）进行表示。例如，模型从不同的句子中提取出“能够使用计算机”这一相同意思的描述，并将其统一表示为符号B。通过进一步分析，得到新的逻辑表达式¬A → ¬B。

2. 逻辑扩展阶段（Logic Extension）

在逻辑扩展阶段，LoT利用Python程序结合基本的逻辑推理法则（如传递法则和对换法则），对提取出的逻辑表达式进行推导和扩展。例如，通过推导，¬A → ¬B和¬B → ¬C可以推导出新的表达式C → A。这一阶段的目的是通过逻辑推理，生成更复杂的逻辑关系，为后续阶段提供更加丰富的信息。

3. 逻辑翻译阶段（Logic Translation）

最后，LoT方法将扩展后的逻辑表达式转化为自然语言描述，并将这些描述与原始输入结合，形成一个增强的输入提示。这一过程通过将命题符号（如C和A）与其自然语言描述（例如“能够使用文字处理程序写作业”和“具备键盘打字技能”）相结合，避免了信息丢失，同时增强了输入的逻辑信息。例如，逻辑表达式C → A被翻译为“如果具备键盘打字技能，那么能够使用文字处理程序写作业”，并作为新的提示信息加入原始输入中。

通过这三个阶段，LoT方法不仅提升了语言模型的逻辑推理能力，还有效避免了信息丢失，为模型提供了更准确、更丰富的推理支持。

逻辑推理框架实例解析

为了更好地理解LoT的流程，我们通过示意图的例子来详细解析整个过程。

1. 原始输入

背景信息（Context）:

“如果你没有键盘技能，你将无法使用电脑。”
“并且如果你不能使用电脑，你就不能用文字处理程序写论文。”

问题（Question）:

“如果上述陈述为真，以下哪一项也必须为真？”

选项（Options）:

A. 如果你不能用文字处理程序写论文，那么你没有键盘技能。
B. 如果你能用文字处理程序写论文，那么你至少有一些键盘技能。
C. 如果你不能用文字处理程序写论文，那么你不能使用电脑。
D. 如果你有一些键盘技能，你就能用文字处理程序写论文。

2. 逻辑提取

在逻辑提取阶段，我们使用LLM从给定的背景信息中提取出核心命题和它们之间的逻辑联系。具体步骤如下：

提取命题：

命题1：如果你没有键盘技能（记作P），你将无法使用电脑（记作Q）。即。
命题2：如果你不能使用电脑（Q），你就不能用文字处理程序写论文（记作R）。即。

符号化表示：

3. 逻辑扩展

在逻辑扩展阶段，我们应用逻辑推理原则来推导新的逻辑表达式。具体步骤如下：

逆否命题：

根据命题1 ，其逆否命题为。
根据命题2 ，其逆否命题为。

连锁推理：

将和结合起来，可以得到。
即：如果你不能用文字处理程序写论文（），那么你没有键盘技能（）。

等价转换：

的等价形式为。
即：如果你有键盘技能（P），那么你可以用文字处理程序写论文（R）。

逆否命题：

的逆否命题为。
即：如果你不能用文字处理程序写论文（），那么你没有键盘技能（）。

最终结论：

从可以推出。
即：如果你能用文字处理程序写论文（R），那么你至少有一些键盘技能（P）。

4. 逻辑翻译

在逻辑翻译阶段，我们将上述逻辑表达式转换为自然语言描述，使其更加直观易懂。具体步骤如下：

翻译结论：

我们的最终结论是：如果你能用文字处理程序写论文（R），那么你至少有一些键盘技能（P）。

对应选项：

这一结论对应于选项B：“如果你能用文字处理程序写论文，那么你至少有一些键盘技能。”

总结

当前的LoT方法支持的连接词和逻辑推理法则还比较有限。如果要增加更多的连接词和推理法则，就意味着在逻辑提取和翻译阶段，提示设计会变得更加复杂，同时逻辑推导的难度也会增加。

另外，LoT依赖LLM进行逻辑符号和表达式的提取，但LLM固有的幻觉问题仍然是一个挑战。具体来说，LLM可能会导致推理中的表达式重复、遗漏重要的逻辑关系，甚至在逻辑表达式上出现偏差。因此，如何进一步提升LLMs在逻辑提取过程中的准确性，避免这些幻觉问题，将是LoT方法未来改进的关键。

编者简介

李剑楠：华东师范大学硕士研究生，研究方向为向量检索。作为核心研发工程师参与向量数据库、RAG等产品的研发。代表公司参加DTCC、WAIM等会议进行主题分享。

命题逻辑演绎推理逻辑表达式命题的否定逻辑框架

文章转载自AI 搜索引擎，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。