如果您拥有的关于 pearson 相关性的唯一信息是 95% 置信区间,您可以从该数据中推断出什么?
例如,如果您的相关系数为 (0.24;0.78),那么最好的推论是什么?
我在统计方面没有很强的背景,所以如果有人可以在没有大量方程式的情况下解释它,那将是更可取的,谢谢!
如果您拥有的关于 pearson 相关性的唯一信息是 95% 置信区间,您可以从该数据中推断出什么?
例如,如果您的相关系数为 (0.24;0.78),那么最好的推论是什么?
我在统计方面没有很强的背景,所以如果有人可以在没有大量方程式的情况下解释它,那将是更可取的,谢谢!
你只能说样本皮尔逊相关系数 (r) 包含在 0.24 到 0.78 的区间内。当测试此区间外的值时,您有 95% 的信心会检测到显着不同的相关性。这意味着变量 X 与样本中的变量 Y 具有某种程度的正线性关系。(我不愿使用这种关系的“强度”的定性描述,因为:1)这是一种过时的思考方式,2)在一个学科中可能是强相关性在另一个学科中可能很弱,以及 3)我不知道用于计算相关系数的样本量。)如果这个实验是独立进行的,对同一总体进行随机抽样,那么 95%(从长远来看)将包含总体参数 rho。
我是从一个善于分析但不是统计学专家的人的角度发表这个评论的。进行线性回归的原因之一是要回答关于两个变量 x 和 y 的值是否相互独立的问题。或者,数据集可能包含它们之间存在某种联系的证据。如果“r”的置信区间包含零,则表明 x 和 y 不相关,并且计算的回归方程没有价值。如果“r”的置信区间不包含零,则有理由相信有理由怀疑 x 的值与 y 的值有某种联系。在这种情况下,如果您正在构建一个包含 x 和 y 作为变量的统计或数学模型,
需要注意的是,因为我不是统计专家,所以我可能会犯这个错误。