我有一个数据集,我试图在正偏变量上强制执行正态性。我发现连续对数转换有助于实现正常性,但我想知道在执行连续对数转换时是否违反了任何统计或理论违规行为。
提前感谢您提供的任何信息或建议!
我有一个数据集,我试图在正偏变量上强制执行正态性。我发现连续对数转换有助于实现正常性,但我想知道在执行连续对数转换时是否违反了任何统计或理论违规行为。
提前感谢您提供的任何信息或建议!
我认为这有助于具体化,而不是抽象化。
想想这种转变的支持。ln要求, ln ln要求, ln ln ln要求,依此类推。你能想到自然满足这些限制的变量吗?此外,如果一个限制是自然的,那么其他限制就不是。因此,虽然您在这里有一个数学家族,但它在统计上并不是很有用。
此外,即使您的数据因意外或其他原因满足这些限制,这些都是非常严重的转换,甚至重复两次。对于大的正值,它们可能是最终的异常值驯服者,但它们也可能产生相反的效果,即通过分离刚好高于下限的任意小值来创建异常值。
如果您想要比对数更强的东西来转换高度偏斜的正值,则(负)倒数是最佳候选者。它还有其他优点,即它的测量单位很容易思考,而且它的解释通常很容易(例如,时间和速率是彼此的倒数)。(如果保持顺序很重要,这里的负号是可选的。)
一个完全不同且更积极的一点是,诸如 loglog ln( ln( )) 和互补 loglog ln( ln非常有用,并且表现为广义线性模型的链接函数。