我对我的 ML 算法的准备数据有疑问。原始数据的格式类似于:
{
"finances": [
{
"assets": 1230.39,
"investments": 3245.39,
"netProfit": 8765.45,
"year": 2017
},
{
"assets": 111.11,
"investments": 222.22,
"netProfit": 333.33,
"year": 2016
},
{
"assets": 1111.11,
"investments": 2222.22,
"netProfit": 3333.33,
"year": 2015
}
],
"someValue": 123.45,
"title": "Hello!"
}
我想知道将财务数据传递给我的算法的最佳方法是什么(年数可以从 0 到 8 不等)。
我正在考虑为每年的每个参数设置新属性,但这会导致在某些情况下有许多非空值,因为并非每条记录都有 8 年的财务历史。
我的问题是:在输入数据中处理此类数据的最佳方法是什么(实际上每个finances元素都会有更多的值(大约 10-15)。