数据形态

数据挖掘 数据集 统计数据 数据
2021-09-27 00:36:00

谁能用清晰的语言解释“数据模式”的一般含义?我知道模态对于分布意味着什么。

3个回答

“数据模态”的一个定义是数据集中包含多少不同类型的数据。

例如:图像以及标签和文本。

不同的模态通常具有非常不同的统计属性,这会使数据集的使用更加复杂。

基数和模是用于理解问题的信息域的两个数据建模概念。对于分析数据对象、数据属性和关系结构,上面给出的术语非常重要。

基数模态之间的主要区别在于基数被定义为用于指定一个对象的出现次数与另一个对象的出现次数相关的度量。相反,模态表示某个数据对象是否必须参与关系。

模态的定义 模 态与基数完全不同。当关系不需要发生或者关系是可选的时,它的值被计算为“o” 。如果有发生关系的强迫,则模态值为“1” 。简而言之,它描述了是否需要两个或多个实体之间的关系。

让我们以 PAN 卡及其相关借记卡持卡人为例。在借记卡持有人表中,将有一个 PAN 卡号,这使得作为银行帐户持有人必须拥有 PAN 卡的 PAN 卡持有人的链接。现在,如果本例中的模态为“0”,则显示一行没有 PAN 卡号,但如果为“1”,则我们应该在 PAN 卡号中有一个值。

因此,如果模态为“0”或更多,则表示借记卡持卡人没有任何 PAN 卡号的“0”因此不需要保留借记卡持有人表不仅维护活动的持卡人数据,还维护已关闭其银行账户的用户的数据,这被称为NULLABLE列,因为它接受一个空字段。

模态为1时,借记卡持卡人必须有一个 PAN 卡号,这意味着没有 PAN 卡号的银行账户不能包含在表中。因此,该列被认为是NOT NULL列,因为它不接受空值

“数据的模态”通常用于指代用于获取数据的测量设备/方法。

例如,磁共振图像和计算机断层扫描图像可能具有相同的“数据类型”(两者都是数组/图像,它们可以具有相同数量的像素/体素)和相同的“数据格式”(您可以将两者都存储为 PNG 文件)但不同的方式- 它们的测量方式不同,图像中的值具有不同的含义(骨骼在 MRI 中是暗的,在 CT 中是亮的)。

一个更明显的例子是,不仅测量设备/方法不同,而且数据类型也不同,例如音频、图像和文本。

所以这可能是关于如何测量数据,而不是关于测量值的分布/模式