过滤掉客观陈述(或说事实)的方法

数据挖掘 分类 数据清理
2022-03-09 06:56:18

我有数百万行包含主观(比如我更喜欢红裙子)和客观(华盛顿出生于 1732 年 2 月 22 日)的陈述或意见。我怎样才能将它们分开?不是手动的。

所谓“客观”,我的意思是如果句子的宾语或谓语发生了变化,就会与事实相冲突。举例来说,在“她更喜欢红裙子。”中,如果我们改变“红色”或“裙子”,(新)陈述将保持正确,这不适用于“华盛顿出生于 2016 年 2 月 22 日”这样的陈述。

应该推出的语句:

  1. 华盛顿出生于 1732 年 2 月 22 日
  2. 华盛顿出生于 1731 年 2 月 21 日
  3. 奥巴马出生于 1732 年 2 月 22 日
  4. 没有人 A 出生于 2016 年 2 月 22 日
  5. 红色是蓝色
  6. 颜色是一天
  7. 我是机器人
  8. 你是一个人

应保留的声明:

  1. 我喜欢咖啡
  2. 红色是我最喜欢的颜色
  3. 我讨厌他
  4. 你太棒了
  5. 你很聪明
  6. 我是几年前出生的
  7. 你很老
  8. 明天会更好
2个回答

没有真正的“客观”陈述。

在你的例子中:如果他那天没有出生怎么办?同样的说法,但它仍然是客观的吗?

你可以假设“1 + 1 = 2”是一个客观的陈述。但是如果我在做二进制数学,那么 1+1=0 怎么办?所以即使这是主观的。

机器将如何区分这些事情,哲学家会在哪些方面存在分歧?

您所能做的就是提供“您的”(主观)客观性想法的训练数据示例。

当我在这个页面上遇到所谓的主观性分析时,我正在寻找一些情绪数据集。我想我的意思可以在这篇论文中找到。