原始二进制文件的橙色文件导入方法

数据挖掘
2022-03-10 05:59:49

我尝试在 io.py 中将二进制导入方法添加到类 FileFormat(metaclass=FileFormatMeta) 中,但放弃了尝试调整 CSV 方法的副本,因为很多内容都是针对 CSV 问题的,而且评论很少……

基本上,给定一个已知类型和元数据的 Ncols x Mrows 原始文件,一个应该能够提供形状、采样率等作为默认值,然后一个“仅”需要满足 Table.from_numpy() 的参数。让我卡住的是创建特定于 Orange 的对象,主要是域对象:

def data_table_from_bin(cls, data, headers=None):
    ...
    domain = Domain(attrs, clses, metas)

    table = Table.from_numpy(domain, X, Y, M, W)
    return table

有没有其他人尝试过这个,或者有什么建议?

1个回答

究竟是什么问题?

创建时,您必须指定每个功能,例如:

from Orange.data import Domain, Table, ContinuousVariable, DiscreteVariable

d = Domain([ContinuousVariable.make('Attribute 1'), DiscreteVariable.make('Attribute 2')])


这是关于域的文档链接(是的,这不是最好的)