提取似乎与已知格式不匹配的类似档案的文件格式分析

逆向工程 文件格式
2021-06-20 14:31:44

下午好,

我希望尝试从专有格式中提取一些数据的技能。我取得了一些进展,但我想联系专家,看看我是否可以获得一些见解。有问题的格式是由“clip studiopaint”软件创建的“.clip”格式。具体来说,这是一个光栅图形编辑器(类似 Photoshop),我想从中获取图像数据。在最基本的用法中,应该有一堆图层,每个图层都是一个图像。(对于光栅图形,不是矢量)

该格式似乎未加密或压缩,而是以某种存档格式拆分。我尝试过的所有常规存档工具都没有任何意义(zip、tar 等)。它可能是我不太熟悉的 Windows 更常见的存档格式。

使用 python 手动解析文件我能够在接近末尾的地方找到一个 sqlite3 格式的原始序列。我能够提取它并读取包含大部分元数据的表。不幸的是,这并没有说明提取图像数据的方法。我能够拆分我在文件中找到的几个分隔符,但仍然找不到任何能够理解分隔部分的图像算法。

文件中的外部分隔符看起来像:

b'CHNKHead' b'CHNKFoot' b'CHNKExta' b'CHNKSQL'

在其中一些块中还有许多内部分隔符,例如:

b'B\x00l\x00o\x00c\x00k\x00D\x00a\x00t\x00a\x00B\x00e\x00g\x00i\x00n\x00C\x00h\x00u\x00n\x00k' b'B\x00l\x00o\x00c\x00k\x00D\x00a\x00t\x00a\x00E\x00n\x00d\x00C\x00h\x00u\x00n\x00k'

(我猜测特殊的空字节分隔可以减少此序列与其他二进制数据匹配的机会?)

无论如何,我附上了我的小python拆分和保存脚本以及我试图阅读的示例CSP文件,以防万一有人有兴趣看一看。http://s000.tinyupload.com/index.php?file_id=04264848249049623399

0个回答
没有发现任何回复~