我是这个世界的初学者。我仍在学习机器学习和人工智能的基础知识,但我手头有一个问题,我不确定可以应用哪种技术或算法。
我正在研究广告中的点击欺诈检测。我需要使用 ML 预测欺诈并学习新的欺诈。
我拥有的数据集是来自 adserver(服务提供商)的视图和点击日志。此数据有一些字段,其中很少列出如下:
"auction_log_bid_id": null,
"banner": 9407521,
"browser": 0,
"campaign": 2981976,
"city": 94965,
"clickword": null,
"content_unit": 4335438,
"country": 1,
"external_profiledata": {},
"external_user_id": null,
"flash_version": null,
"id": 6665230893362053181,
"ip_address": "80.187.103.98",
"is_ssl": true,
"keyword": "string"
"mobile_device": -1,
"mobile_device_class": -1,
"network": 268,
"new_user_id": 6665230893362118717,
"operating_system": 14,
"profile_data": {},
"referrer": null,
"screen_resolution": null,
"server_id": 61,
"state": 7,
"target_url": "string"
"timestamp": 1551870000,
"type": "CLICK_COMMAND",
"user_agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 12_1_4 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/16D57",
"user_id": null,
"view_log_id": null
还有其他领域。
我需要分析这些日志以找到可能的欺诈模式,但我不确定从哪里开始以及使用哪种技术。例如监督、无监督的半监督或强化学习。