数据科学密室逃脱可能面临的挑战

数据挖掘 机器学习 统计数据 可视化 数据清理 数据分析
2022-01-26 21:29:51

亲爱的数据科学社区,

作为我的学士学位项目,我正在研究物理数据科学逃生室的概念。密室逃脱的目标是提高人们对数据科学/一般数据重要性的认识,并激励“逃避者”更多地了解数据科学。

逃生室将是一个物理房间,需要通过完成与数据科学相关的不同挑战来逃脱。目标群体是那些已经以报告或类似形式处理数据的人,但没有或几乎没有数据科学背景。

这个逃生室可能面临的挑战可能是使用需要训练的简单机器学习算法或简单的统计概念。玩家还可能需要管理数据,然后需要将其集成以供日后使用。

我正在寻找这个逃生室可能面临的挑战的想法或进一步的输入,并希望有一些数据科学专家提供创造性的输入!

谢谢!

2个回答

乐趣!很酷的想法,但这似乎是一项艰巨的任务。无论如何,这是我的建议:

概括

2D 逻辑回归的手动拟合,只有在完成之前的某个步骤后才能解决。

解释

我想象被一个看起来像这样的屏幕打招呼:

第一眼

这两个框是逃脱者可以输入数字的输入。如果他们尝试随机输入,则可能会发现数字代表B0B1

Y=B0+B1X1

这仍然会让他们感到困惑,因为他们只会看到如下内容:

测试输入

然而,当房间中的其他挑战完成时,真正的挑战会通过对点进行着色来揭示。

彩色的

然后他们只需要找到合适的截距和系数即可完成挑战。

完成的

我认为如果有足够的样本,这将非常有效,这样您将无法通过在它们知道颜色之前尝试值来破解它。如果挑战太容易了,你可以让它们拟合多项式。

建议 1:人与机器

您可以尝试通过让机器在与其领域或日常生活相关的任务中与机器竞争(例如对来自图像网络的图像进行分类)来展示数据科学的力量。

建议2:人类的大脑

您还可以将其分成组(层),并假设每个人都是神经网络中的一个神经元。他们应该在没有看到整个输入的情况下猜测输入标签。(我正在使用 Mind Field Episode The Stilwell Brain作为灵感)