将财务数据与新闻一起存储的最佳方式

数据挖掘 时间序列 金融
2022-02-12 23:15:31

我的问题是是否有允许将财务数据(即时间戳+值)与小文本片段一起存储的 DBMS。

这些小片段不会很长,但它可能有助于算法预测未来的变化。总之,我想知道您是否可以建议我大规模存储时间戳+数值+(可选)文本片段的最佳方式。

先感谢您。

1个回答

简短的回答是(几乎)任何 DBMS 都可以为您存储该信息。

我使用 Microsoft SQL,您可以使用指定的或系统计算的日期时间、数值列存储记录,您可以通过以下四种方式之一存储故事文本:

  • 纯文本作为 NVARCHAR
  • XML 格式的结构化文本(如果您使用的是 SQL2016 或更高版本,则为 JSON)
  • 文件流,如果数据格式是二进制(通常是图像、音频或视频)
  • 作为对磁盘上文件的引用

MSSQL是一个RDBMS(关系型数据库管理系统),这个分类中的其他还有Oracle、MySql、Postgress。还有另一类数据库被归类为 NOSQL 或文档数据库,包括 Mongo、CouchDB、DocumentDB 和 RavenDB。这些与 RDBMS 的不同之处在于它们存储数据和管理关系的方式(例如,查找 4 月 1 日至 6 月 6 日期间与公司 X 相关的所有文章)

我建议,如果您不知道将来要如何处理数据,请考虑将其存储在 NOSQL 数据库中,因为它提供了更大的记录结构灵活性。大多数可以使用免费/开源许可证在本地安装,大多数也可以在托管平台上以相对较小的金额使用。对于此类项目,许多 RDBMS(尤其是 Oracle 和 MSSQL)都非常昂贵。也就是说,Azure SQL - SQL 的托管版本每月只需 8 美元,具体取决于您的存储需求。