你好,我是一个外行,试图分析英雄联盟的游戏数据,特别是在给定物品构建的情况下预测给定英雄的胜率。
大纲
游戏结束时,玩家最多可以拥有 6 件物品。他们可以在游戏过程中以不同的顺序购买这些物品或调整他们的库存位置。
以这种方式,数据集可能包含以下行:
champion id | items ids | win(1)/loss(0)
----------------------------------------------------------------------------
45 | [3089, 3135, 3151, 3157, 3165, 3285] | 1
45 | [3151, 3285, 3135, 3089, 3157, 3165] | 1
45 | [3165, 3285, 3089, 3135, 3157, 3151] | 0
虽然项目的顺序不同,但构建是相同的,但我最初的想法是简单地将项目 ID 相乘,因为这会给我一个整数值,代表 6 个项目的组合。
虽然有数百种物品,但实际上英雄会抽取其中的一小部分(约 20 种)来形成其构建的核心(3 种物品)。游戏也可能在玩家有时间购买 6 件物品之前结束:
items ids
------------------------------------------
[3089, XXXX, 3151, 3285, 3165, 0000]
[XXXX, 3285, XXXX, 3165, 3151, 0000]
[3165, 3285, 3089, XXXX, 0000, 0000]
XXXX item from outside core subset
0000 empty inventory slot
由于项目 3089 恭维冠军 45 具有项目 3089 的核心构建比缺少项目 3089 的核心构建具有更高的胜率。
每个冠军可用的数据集大小在 10000 到 100000 之间变化。平均值可能在 35000 左右。
问题
- 这是一个适合监督分类的问题吗?
- 我应该如何寻找核心项目组及其胜率?