什么是 XML 数据集?

数据挖掘 数据挖掘
2022-03-14 00:49:32

什么是 xml 数据集?是否可以将它们转换为 csv 文件?我正在开发一个 Java 程序,有时我会下载二进制格式的数据集,这些是 xml 吗?

谢谢你。

1个回答

XML 是一种类似于 html 的标记语言。一种使用带有属性的标签来构建数据结构。例如,

<sampleXML>
  <Menu>
    <Food>
      <item1>Spaghetti Bolognese</item1>
      <item2>Spaghetti Carbonara</item2>
    </Food>
    <Drinks>
      <item1 class = 'drinks'>Sprite</item1>
    </Drinks>
  </Menu>
</sampleXML>

正如您所看到的,XML 使用诸如HTML 所具有的标签等<Food></Food>属性。class = 'drinks'要在 java 中访问 XML 数据,您有几个选择。您可以将其作为字符串读取并使用内置的 DOM 解析器对其进行解析或者,您可以使用 JAXB 将XML 直接映射到 Java 对象

当然,您可以将 XML 转换为 csv 文件。网上有免费的网站。只需谷歌“XML 到 csv 转换器”。

二进制文件不是 XML,但可以是。这几乎不需要解释。您在此处看到的字母和单词是 ASCII 字符。这是人类可读的文本。每个 ASCII 字符都有一个二进制表示。例如,二进制中的 j 是 1101010。二进制文件是计算机语言中的任何文件(0 到 1)。二进制文件也可以是文本和二进制的组合。您可以将二进制转换为 ASCII,而您下载的那些文件可能确实是我上面描述的 XML。要将二进制转换为 ASCII,只需 google 即可。