我在哪里可以下载股票的历史市值和每日成交量数据?

数据挖掘 数据集
2021-09-19 02:36:50

有很多来源提供历史库存数据,但它们仅提供 OHLC 字段以及交易量和调整后的收盘价。我还发现一些来源提供了市值数据集,但仅限于美国股票。雅虎财经在线提供了这些数据,但没有下载选项(或者我不知道)。

  • 我在哪里可以使用股票代码下载属于各个国家顶级证券交易所的股票的数据?
  • 有什么方法可以通过 Yahoo Finance 或 Google Finance 下载吗?

我需要过去十年左右的数据,因此需要一些脚本或 API 来执行此操作。

3个回答

Quant SE 更适合解决与获取财务数据相关的问题:

就收集数据而言,您可以查看Quandl (如果您有兴趣,可以查看有关DataCamp 上将它与R一起使用的教程)。

此外,Aswath Damodaran 的网站包含许多有用的数据集。尽管它们没有那么频繁地更新,但它们可能仍然有用,尤其是作为比较您自己的输出的基准(来自您将不可避免地需要编写的脚本来计算必要的指标)。

而且,再次,Quant SE可能是一个更好的地方寻找......

最近这个网站发生了一些变化。下面的代码对我有用。

import csv
import requests
from bs4 import BeautifulSoup

url_base = "https://finviz.com/quote.ashx?t="
tckr = ['MSFT','AAPL','AMZN','FB','GOOG']

i = 1

url_list = [(s, url_base + s) for s in tckr]

headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:76.0) Gecko/20100101 Firefox/76.0'}

with open('C:\\Users\\ryans\\OneDrive\\Desktop\\AAA.csv', 'w', newline='') as f_out:
    writer = csv.writer(f_out, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
    for t, url in url_list:
        print(i)
        i = i + 1
        print(t, url)
        print('Scrapping ticker {}...'.format(t))
        soup = BeautifulSoup(requests.get(url, headers=headers).content, 'html.parser')
        writer.writerow([t])
        for row in soup.select('.snapshot-table2 tr'):
            writer.writerow([td.text for td in row.select('td')])

我删除了旧的、不工作的代码。