我正在研究区块链上的欺诈检测。更具体地说,我获取了在区块链上发生的大量交易,使用适当的 API 将它们标记为垃圾邮件/非垃圾邮件,现在我将训练一个模型来使用 SVM 检测欺诈等......
我的问题是关于数据的准备。我拥有的字段是:hash,nonce transaction_index,from_address,to_address,...
“from/to_address”字段是十六进制字段,例如 0x5e14d30d2155c0cdd65044d7e0f296373f3e92f65ebd
我的问题是,我应该如何格式化这些数据?我应该删除这个字段吗?(我不这么认为,因为它与手头的问题非常相关)。我也找不到合适的编码。