衡量幸福的算法或公式?

数据挖掘 数据挖掘 数据
2021-10-02 01:16:07

我正在做一个项目,该项目在给定的 Facebook 页面中接受评论,并根据页面的用户确定它的平均幸福评级。我的问题是我在哪里可以找到公式、评级或任何其他文献来帮助我找到一种使用单词和单词集合来衡量幸福的方法?

我正在寻找类似于余弦相似度的东西,但不是为了找到相似的单词,而是为了找到与单词或单词集合相关的平均积极性或幸福感。

我不完全确定这是这个问题的正确位置,但它与 Facebook 内的数据和大数据有关,所以我希望要么得到一个问题,要么被引导到我可以找到我的地方回答。在此先感谢您的帮助。

3个回答

您应该关注自然语言处理,特别是情感分析

我提供的链接是学习情绪分析的一个很好的起点。如果这是您正在寻找的,它可以作为斯坦福核心 NLP的一部分。

对于您的问题,这些不存在绝对解决方案,但我可以建议您一些可能会有所帮助的技术。
如果我没记错的话,那么您基本上是在尝试将英语解释为人类情感。
关于这个主题有完整的理论,在做了一些研究之后,我想出了两件事情,在你的情况下可能会很方便。

  1. 情感计算
    主要思想是,您收集口头数据(尽可能多),然后对口头数据应用机器学习算法(分类)来确定口头数据是否与“幸福”相关. 你可以想出尽可能多的重要特征。一个功能可以是,您可以为每个单词分配一个数字,例如 (happy=1, happier=3, happy=10)...这只是一个示例。另一个特征可能是,你试图找出句子中的“不”和“否定”,因为“不开心”显然会让你在你的特征中得到负值。你可以想出尽可能多的相似的语言特征。在计算出合理数量的特征后,您可以简单地应用上述算法,
  2. Sentiment Analyzer
    我刚找到这篇研究论文,它和自然语言处理一起工作,在处理完语言之后,它会分析人的情绪,或者说来源。你可以自己去学习。

你为什么不根据对你的文本(即facebook评论)的抽样来经验性地获得幸福。您可以招募评论者(根据您的需要,“天真的”参与者或心理学/情感专家)。给审阅者某种等级来对文本进行评分——或者将文本分类为正面、负面或中性,或者让他们以 likert 类型的等级对文本进行评分,例如,在 1 到 10 的范围内,最大为 10,有多开心你认为这段文字是什么?)。通过拥有多个审阅者,您可以设置可靠性阈值的阈值(例如,3 个审阅者中必须有 2 个就分配/分数达成一致;2 个审阅者就分歧达成共识,等等)。然后,此数据将成为您的标记训练数据,您可以使用这些数据对剩余数据进行评分。