我试图确定哪些属性在我的数据集中不相关,以便在拟合分类器之前将其删除。
目标是具有三个不同值的分类变量。
我也有很多数字属性。
对于方差分析,我使用了以下代码:
grouped_test2=df[['room_type', 'price']].groupby(['room_type'])
f_val, p_val = stats.f_oneway(grouped_test2.get_group('Entire home/apt')['price'], grouped_test2.get_group('Private room')['price'], grouped_test2.get_group('Shared room')['price'])
自变量是room_type,解释变量是price。
在这种情况下,f_val 等于 1061.64,p_val 等于 0。
我读到 0 或接近 0 的值意味着这两个变量之间存在关系,但我不确定?
什么意味着 f_val 足够接近 0 才能说这两个变量是相关的?