如图1所示,大多数收入中值集中在20,000美元至50,000美元之间,但一些收入中值远远超过60,000美元。
我不明白为什么 Housing['median_income'] 必须除以 1.5 背后的解释
housing['income_cat'] = np.ceil(housing['median_income'] / 1.5)
说明 - 在数据集中为每个层提供足够数量的实例非常重要,否则对层重要性的估计可能会出现偏差。
有人可以帮我理解解释,为什么它只有 1.5 ?根据解释,为什么当每个类别都没有足够的实例时,对层重要性的估计会有偏差?
