如何在 Orange 中处理多变量问题

数据挖掘 数据挖掘
2022-02-28 05:51:02

你能解释一下如何在Orange中处理多变量问题吗?例如:我有社会学调查数据库。其中有一个问题:

你想怎样度过你的周末?(只选3个):

  1. 在家里
  2. 和朋友
  3. 和家人一起
  4. 在上班

这是数据库示例:

在此处输入图像描述

数据库逻辑:最多选择三个选项 - 3 列。受访者回答的顺序无关紧要。是否有可能根据这三列在橙色中制作频率直方图?

2个回答

既然你说选择的顺序无关紧要,我认为如果你首先将数据库转换为一个热编码特征的宽表,你的数据将更容易管理(在任何工具中,包括 Orange),每个选项都是自己的专栏:

id    weekend_home    weekend_friends    weekend_family    weekend_work
1     1               1                  1                 0
2     1               1                  0                 0
3     0               1                  0                 0
4     1               1                  0                 0
5     1               1                  1                 0

在橙色有一个功能“创建类”(数据模块),在那里您可以选择必要的答案并将它们转换为二分法。你有一个分类尺度,你需要创建一个更复杂的规则,可能需要计算一个新变量。 在此处输入图像描述