我是一名法律系学生,研究哪些因素会影响公司的 CSR(企业社会责任GSE_RAW)行为。由于我的学习没有提供任何统计课程,我很难理解我应该对我的数据执行哪种类型的统计分析。在描述了数据之后,我希望你们中的一些人能告诉我更多关于这一点的信息。
已经确定了两组可能影响企业社会责任的因素/变量:特定于公司的和特定于国家的。
首先,公司特定的变量是
MKT_AVG_LN: 公司市值SIGN:公司签署的CSR条约数量INCID:公司参与的社会责任事件报告数量
其次,数据集中的 4,000 家公司中的每一家都将总部设在 35 个国家之一。对于每个国家,我收集了一些特定国家的数据,其中包括:
LAW_FAM: 国家法律体系的法律家族(法语、英语、斯堪的纳维亚语或德语)LAW_SR:国家公司法对股东的相对保护(例如,在公司违约的情况下)LAW_LE:国家法律体系的相对有效性(价值越高意味着越有效,例如腐败越少)COM_CLA: 衡量内部市场竞争的强度GCI_505: 初等教育质量测量GCI_701: 衡量中等教育质量HOF_PDI:权力距离(更高的价值意味着更多的等级社会)HOF_LTO: 国家时间方向(越高意味着更长期的方向)DEP_AVG: 各国人均国内生产总值CON_AVG: 各国在 2008-2010 年期间的平均通货膨胀率
为了对这个数据进行分析,我把国家层面的数据“提升”到了公司层面。例如,如果比利时的COM_CLA值为 23,则数据集中的所有比利时公司的COM_CLA值都设置为 23。该变量LAW_FAM分为 4 个虚拟变量(LAW_FRA、LAW_SCA、LAW_ENG、LAW_GER),每个公司的其中一个虚拟变量为 1 .
这一切都会产生这样的数据集:
COMPANY MKT_AVG_LN ... INCID ... LAW_FRA LAW_SCA ... LAW_SR LAW_LE COM_CLA ... etc
----------------------------------------------------------------------------------
1 1.54 55 0 1 34 65 53
2 1.44 16 0 1 34 65 53
3 0.11 2 0 1 34 65 53
4 0.38 12 1 0 18 40 27
5 1.98 114 1 0 18 40 27
. . . . . . . .
. . . . . . . .
4,000 0.87 9 0 1 5 14 18
在这里,公司 1 到 3 来自同一个国家 A,而公司 4 和 5 来自 B 国。
我的DV,GSE_RAW是评级机构给出的每家公司CSR行为的数值。
- 我相信国家级变量也称为“分类”变量,因为许多公司对这些变量具有相同的值(在上面的示例中,公司 1 到 3 都具有相同的
LAW_FRAto值COM_CLA)。我相信已经发现“分类”变量也称为固定因子。这一切都是真的吗? - 由于分类(国家级)变量,我认为 OLS 回归分析在这里不是合适的模型。有人建议使用“广义线性模型”(GLS),将国家级变量用作(固定?)“因素”,将公司级变量用作“协变量”。这个对吗?作为一个子问题:由于国家层面的变量,为什么 OLS 不合适?他们在 OLS 计算中所做的哪些事情导致了回归?
[edit 1]我正在使用 SPSS 进行统计分析
[edit 2]在这里,我尝试使用这些数据创建 GLM。但是,我无法得到“您尚未指定自定义模型”我是否必须在这里选择所有 4 个变量(因为我想要所有 4 个变量的 beta 和显着性水平来构建回归模型)?如果是这样,为什么我必须这样做两次?我在之前的对话框中已经说过DEP_AVG和CON_AVG是固定因素并且SIGN和INCID是协变量。例如,为什么我要INCID在此处插入协变量,但不将其包含在模型构建对话中?另外,我真的不明白我得到的输出,因为它与普通的 OLS 输出有很大的不同(唯一让我感到有点舒服的输出)。
- 我现在做正确的分析吗?
- 如何从中获得回归模型?
