我有大约 20,000 个 .asm 文件从 IDA pro 输出通过十六进制射线。
这些都是由已知的恶意软件创建的,并且都来自 32 位 Windows 便携式可执行文件。
我没有原始的可执行文件,只有反汇编的输出(.asm)文件。
我试图获得的是任何可能的助记符列表(即添加、异或、跳转等),IDA 可以输出到 .asm 文件中
有了这个列表,我将尝试使用 grep(或类似的)来编译统计数据的机器学习/恶意软件分类任务。
在本网站的帮助下,我手工制作了 30 个左右的列表(jmp、push、mov、call、lea 等),其中列出了常见的说明http://www.strchr.com/x86_machine_code_statistics。
这些文件的标题中是否有任何线索可以帮助定义可能的助记符?这些是跨平台一致的还是特定于原始文件的某些属性?
我搜索了 IDA pros 文档,似乎在反汇编过程中可以使用所有功能,但我坚持使用 .asm 文件进行解析。
类似的问题没有帮助。
示例 .asm 头文件
;
; +-------------------------------------------------------------------------+
; | This file has been generated by The Interactive Disassembler (IDA) |
; | Copyright (c) 2013 Hex-Rays, <support@hex-rays.com> |
; | License info: |
; | Microsoft |
; +-------------------------------------------------------------------------+
;
; ---------------------------------------------------------------------------
; Format : Portable executable for 80386 (PE)
; Imagebase : 400000
; Section 1. (virtual address 00001000)
; Virtual size : 0002964D ( 169549.)
; Section size in file : 00029800 ( 169984.)
; Offset to raw data for section: 00000400
; Flags 60000020: Text Executable Readable
; Alignment : default
; OS type : MS Windows
; Application type: Executable 32bit
include uni.inc ; see unicode subdir of ida for info on unicode
.686p
.mmx
.model flat
; ===========================================================================
从内部取样
.text:00401080 ; ---------------------------------------------------------------------------
.text:00401081 CC CC CC CC CC CC CC CC CC CC CC CC CC CC CC align 10h
.text:00401090 8B 44 24 10 mov eax, [esp+10h]
.text:00401094 8B 4C 24 0C mov ecx, [esp+0Ch]
.text:00401098 8B 54 24 08 mov edx, [esp+8]
.text:0040109C 56 push esi
.text:0040109D 8B 74 24 08 mov esi, [esp+8]
.text:004010A1 50 push eax
.text:004010A2 51 push ecx
.text:004010A3 52 push edx
.text:004010A4 56 push esi
.text:004010A5 E8 18 1E 00 00 call _memcpy_s
.text:004010AA 83 C4 10 add esp, 10h
.text:004010AD 8B C6 mov eax, esi
.text:004010AF 5E pop esi
.text:004010B0 C3 retn
.text:004010B0 ; ---------------------------------------------------------------------------
感谢您提供有关解决此问题的最佳方法的任何指示或线索,如果这不适合本论坛,我深表歉意。