我有一个user_data包含各种字段的表格,其中一些是基于地理的。
我想为每个用户记录添加额外的列,如expected_income_in_region、city_population、等来丰富数据。life_expectancy_in_state
我想在sql查询中使用这些扩展字段(在进行其他python操作之前)
是获取这些数据的标准方法,还是我需要从美国人口普查局抓取并自己格式化?
我有一个user_data包含各种字段的表格,其中一些是基于地理的。
我想为每个用户记录添加额外的列,如expected_income_in_region、city_population、等来丰富数据。life_expectancy_in_state
我想在sql查询中使用这些扩展字段(在进行其他python操作之前)
是获取这些数据的标准方法,还是我需要从美国人口普查局抓取并自己格式化?
如果您希望使用美国人口普查数据,美国 FactFinder 网站:https ://factfinder.census.gov/faces/nav/jsf/pages/index.xhtml允许您以不同方式搜索人口普查数据,然后下载表格以 csv 格式。
例如,在Community Facts网站上,您可以输入州、县、市、镇或邮政编码,并获取您输入的地理位置的人口。然后您可以单击页面左侧列出的主题(年龄、商业和行业、教育等)查看有关您所在地区的其他有趣信息,或单击“该地区的热门表格”下的链接查看包含您社区的其他数据的表格。
或者,您可以使用高级搜索功能使用站点提供的所有搜索功能搜索所有可用数据。
此外,我自己对此了解不多,但至少存在一个 Github存储库,其中包含“用于从美国人口普查局数据集中导入最近的美国社区调查发布的 SQL 脚本和其他支持文件”。这些脚本是根据 GNU 通用公共许可证发布的。