我正在尝试分析FakeNewsNet哪个是社交网络分析的假新闻数据集。
数据集中有用户的 UUID(我不确定实体名称),但我不确定如何从中检索元数据。
有人可以向我解释在哪里可以找到有关如何使用 user_id of 的信息User.txt吗?
甚至可以检索具有此 ID 的用户的元数据吗?(可能使用 Twitter 搜索 API)
参考:https ://github.com/KaiDMML/FakeNewsNet/blob/master/Data/BuzzFeed/User.txt
我正在尝试分析FakeNewsNet哪个是社交网络分析的假新闻数据集。
数据集中有用户的 UUID(我不确定实体名称),但我不确定如何从中检索元数据。
有人可以向我解释在哪里可以找到有关如何使用 user_id of 的信息User.txt吗?
甚至可以检索具有此 ID 的用户的元数据吗?(可能使用 Twitter 搜索 API)
参考:https ://github.com/KaiDMML/FakeNewsNet/blob/master/Data/BuzzFeed/User.txt
当前版本的数据集是不可能的,User.txtID 是散列的。UserFeature.mat但是,您可以在其中加载类似的预处理功能
import scipy.io
mat = scipy.io.loadmat('UserFeature.mat')
mat['X'][0]然后将是文本文件中第一个用户 ID 的特征向量。
也没有功能名称的描述(或者至少我没有找到)