当前位置：首页 > news >正文

关系分类(RC)模型和关系抽取(RE)模型的区别

news 2025/7/19 6:45:13

目标不同

关系分类模型：对给定的实体对在给定句子中预测其关系类型。两阶段（RC）

关系抽取模型：从句子中识别出所有潜在实体对，并为其预测关系类型。一阶段（NER+RE）

训练：
输入：句子 + 实体对| 句子：苹果公司总部位于加州库比蒂诺| 实体对：(苹果公司, 加州库比蒂诺)| 标注真实关系标签：位于
输出：模型预测关系：位于

预测：
输入：句子 + 实体对| 句子：苹果公司总部位于加州库比蒂诺| 实体对：(苹果公司, 加州库比蒂诺)
输出：模型预测关系：位于

输入：句子：乔布斯是苹果公司的创始人标注真实集合：实体集合：{乔布斯: 人物, 苹果公司: 组织}关系集合：{(乔布斯, 创立, 苹果公司)}输出：模型生成：实体集合：{乔布斯: 人物, 苹果公司: 组织}关系集合：{(乔布斯, 创立, 苹果公司)}

输入：句子：乔布斯是苹果公司的创始人输出：预测的实体集合：{乔布斯: 人物, 苹果公司: 组织}预测的关系集合：{(乔布斯, 创立, 苹果公司)}

关系分类模型和关系抽取模型在训练时使用的数据集是不同的，因为它们的任务目标和方法逻辑不同。以下是两者在数据集格式和内容上的主要区别：

目标：从给定的句子和实体对中预测其关系类型。

每条数据是一个三元组，包括句子、实体对和关系标签。

内容：
1. 句子：单个句子，包含明确的上下文。
2. 实体对：两个实体，通常以 (实体1, 实体2) 的形式表示。
3. 关系标签：从一个固定的关系集合中选择一个标签。

示例：

数据：
- 句子：乔布斯是苹果公司的创始人。
- 实体对：(乔布斯, 苹果公司)
- 关系标签：创立

目标：从一个句子中同时识别所有的实体和它们之间的关系。

每条数据是一个整体标注，包括句子、实体集合和关系集合。

内容：
1. 句子：一个包含多个实体及其潜在关系的句子。
2. 实体集合：多个实体及其类别，通常以 {实体: 类别} 的形式表示。
3. 关系集合：所有可能的实体对及其关系，通常以 {(实体1, 关系, 实体2)} 的形式表示。

示例：

数据：
- 句子：乔布斯是苹果公司的创始人。
- 实体集合：{乔布斯: 人物, 苹果公司: 组织}
- 关系集合：{(乔布斯, 创立, 苹果公司)}

各个数据集的各个模型最新排名-SOTA：Relation Extraction | Papers With Code

SemEval-2010 Task-8：这个数据集主要用于关系分类，它包含了多个预定义的关系类别，模型需要识别实体对之间的关系。9 种有向关系 + 1 种无关系，总共 10 种关系
ACE 2005：这个数据集也用于关系分类，它包含了实体和它们之间的关系，需要模型识别实体对之间的关系类型。7种关系类型