我正在做一个项目,目前正在试验聚类分析。数据集主要是分类变量和离散数字。由于我对 MathJax 不是很熟悉,请原谅我的编程能力不佳,但我将在以下三个示例中尝试用文字总结数据集。
- 假设第 1 列当然是参与者姓名,从第 2 列到第 5 列,每列的值范围从 1(最不重要)到 5(最重要)。所以在这种情况下,第 2-8 列只有离散数据。
- 例如第 6 列,因为这是一道选择题。第 1 行选择“nice”作为答案,但是,第 2 行选择了“poor”。在这种情况下,我们有一列包含多个分类答案。
- 对于第 7-9 列,这是另一种类型的多项选择题。然而这一次,每一列只代表一个答案。第 7 列只允许字符串值“true”,第 8 列只允许字符串“somewhat”。所以在这种情况下,我们有多个列代表同一问题的多个答案。
任何想法如何解决这个问题?感谢任何输入!
A2 A3 A4 A5 A6 A7 A8 A9
1 4 5 4 nice true somewhate false
2 4 3 1 poor true false
1 5 2 1 nice somewhate
3 2 1 5 nice true false