您引用了几条建议,毫无疑问,所有这些建议都是有帮助的,但很难从中找到很多优点。
在每种情况下,我都完全依赖您引用的摘要。在作者的辩护中,我想相信他们在周围或其他材料中添加了适当的资格。(通常名称、日期、标题、(出版商、地点)或(期刊标题、卷、页)格式的完整参考书目将增强问题。)
场地
该建议旨在提供帮助,但充其量只是过于简单化了。菲尔德的建议似乎是普遍的。例如,对 Levene 检验的引用意味着对方差分析的一些临时关注。
例如,假设我有一个预测变量,应该记录各种理由,另一个指标变量是( 1 , 0 ). 后者 (a) 不能被记录 (b) 不应该被记录。(实际上,将指示变量转换为任何两个不同的值都没有重要影响。)
更一般地说,在许多领域中,通常情况下,一些预测变量应该被转换,其余的保持原样,这是很常见的。
确实,在论文或论文中遇到对不同预测变量应用不同的转换的混合(包括作为特殊情况、身份转换或保持原样)通常是读者关心的问题。混合是经过深思熟虑的选择,还是任意和反复无常的?
此外,在一系列研究中,方法的一致性(总是对响应应用对数,或者从不这样做)确实有助于比较结果,而不同的方法使其变得更加困难。
但这并不是说永远不可能有混合转型的理由。
我认为您引用的大部分部分与您以黄色突出显示的关键建议没有太大关系。这本身就是一个令人担忧的问题:宣布一个绝对规则然后不真正解释它是一件奇怪的事情。相反,禁令“记住”表明菲尔的理由是在本书的前面提供的。
匿名论文
这里的上下文是回归模型。通常,谈论 OLS 奇怪地强调估计方法而不是模型,但我们可以理解其意图。GWR 我解释为地理加权回归。
这里的论点是您应该转换非正态预测变量并保持其他变量不变。同样,这提出了一个问题,即您可以和应该如何处理不能正态分布的指标变量(如上所述,可以通过指出在这种情况下的非正态性不是问题来回答)。但是该禁令反过来暗示了预测变量的非正态性才是问题所在。不是这样;假设预测变量的边际分布不是回归建模的一部分。
在实践中,如果您使预测变量更接近正态,那么您通常会应用转换来生成函数形式Xβ更接近于数据,尽管在许多文本中都非常强调错误结构,但我会断言这是转换的主要原因。换句话说,如果您在转换后的空间中更接近线性,那么记录预测变量以使其更接近正态性可能会出于错误的原因做正确的事情。
在这个论坛上有很多关于转换的非常好的建议,我专注于讨论你引用的内容。
PS您添加了一条以“例如,在比较均值时,将日志与原始数据进行比较显然会产生显着差异”的语句。我不清楚您的想法,但是将一组的值与另一组的值的对数进行比较是荒谬的。我完全不明白你的其余陈述。