我收集了有关动物的环境数据,并正在寻求有关如何处理某些变量的帮助,其中非数字值可以提供信息,但也存在问题。我有三个相互依赖的变量:日志、到日志的距离和最近日志的直径。这些品质是在动物所在的 1 米平方象限周围 4 米半径的样本区域内测量的。
- 在log : NA 的情况下,我无法对象限或周围 4m 区域(无法访问)进行采样,None 表示采样区域中不存在日志,这意味着它在逻辑上可能等于 0。
- 对于到日志的距离,如果日志为“无”或“0”,则 NA 不合适,因为这再次意味着我无法对空间进行采样,但到日志的距离值为“0”意味着日志是在 1 米平方象限内,如果在 4 米样本区域内确实没有日志,这是不正确的。[1 平方米的象限代表整个动物]。
- 存在与最近原木直径相同的问题:NA 表示我无法对空间进行采样,但值为 0 表示测得的原木直径为“0 厘米”,而原木的直径实际上不能为零(在这个实验中,原木是直径大于 7.5 厘米的木块)。
因此,对于最近原木的距离和直径,如果原木不存在,则 0 不能是逻辑结果,但如果存在原木,则到最近原木的距离为零。有关如何解决此字符与数字问题以进行统计分析的任何建议?解决方案可能必须使用“无”、“0-1”、“1-2”等值来制作这些分类变量,我需要修改使用分类和处理重复测量的多元模型数值数据。
最终目标是对许多环境变量进行多变量分析,以比较动物选择的环境与森林中可用的、随机选择的环境。
先感谢您。