我有一个地区、农田面积和为这些地区发放的化肥补贴的数据集。即,使用编造的数字,
district | area | subsidy | subsidy per area (computed)
abc | 20 | 500 | 25
cde | 30 | 750 | 25
fgh | 0.02 | 15 | 750 <--- looks off
我试图想象每个地区的补贴,但在农业数量非常少的地区,每个地区的补贴似乎不正常。全国平均水平几乎在 25 左右。因此,我可以肯定地说,补贴金额与受补贴的面积直接相关,这是可以预料的,因为化肥的使用取决于耕作的面积。我的理论是,小面积的例外是由于无论土地面积如何,都有最低补贴金额。
在可视化数据时是否有任何技术可以处理上述场景?