处理股票数据

这段时间某国股市很火爆,不少砖家在分析股市火爆的各种原因,更有不少人看到别人挣钱眼红了,点钞票杀入股市。不过,我还是很淡定的,因为没钱,所以不用担心任何股市风险临到。

但是,为了体现本人也是与时俱进的,就以股票数据为例子,来简要说明 pandas 和其它模块在处理数据上的应用。

下载 yahoo 上的数据

或许你稀奇,为什么要下载 yahoo 上的股票数据呢?国内网站上不是也有吗?是有。但是,那时某国内的。我喜欢 yahoo,因为她曾经吸引我,注意我说的是www.yahoo.com,不是后来被阿里巴巴收购并拆散的那个。

处理股票数据 - 图1

虽然 yahoo 的世代渐行渐远,但她终究是值得记忆的。所以,我要演示如何下载 yahoo 财经栏目中的股票数据。

  1. In [1]: import pandas
  2. In [2]: import pandas.io.data
  3. In [3]: sym = "BABA"
  4. In [4]: finace = pandas.io.data.DataReader(sym, "yahoo", start="2014/11/11")
  5. In [5]: print finace.tail(3)
  6. Open High Low Close Volume Adj Close
  7. Date
  8. 2015-06-17 86.580002 87.800003 86.480003 86.800003 10206100 86.800003
  9. 2015-06-18 86.970001 87.589996 86.320000 86.750000 11652600 86.750000
  10. 2015-06-19 86.510002 86.599998 85.169998 85.739998 10207100 85.739998

下载了阿里巴巴的股票数据(自 2014 年 11 月 11 日以来),并且打印最后三条。

画图

已经得到了一个 DataFrame 对象,就是前面已经下载并用 finace 变量引用的对象。

  1. In[6]: import matplotlib.pyplot as plt
  2. In [7]: plt.plot(finace.index, finace["Open"])
  3. Out[]: [<matplotlib.lines.Line2D at 0xa88e5cc>]
  4. In [8]: plt.show()

于是乎出来了下图:

处理股票数据 - 图2

从图中可以看出阿里巴巴的股票自从 2014 年 11 月 11 日到 2015 年 6 月 19 日的股票开盘价变化。看来那个所谓的“光棍节”得到了股市的认可,所以,在此我郑重地建议阿里巴巴要再造一些节日,比如 3 月 3 日、4 月 4 日,还好,某国还有农历,阳历用完了用农历。可以维持股票高开高走了。

阿里巴巴的事情,我就不用操心了。

上面指令中的 import matplotlib.pyplot as plt 是个此前没有看到的。matplotlib 模块是 Python 中绘制二维图形的模块,是最好的模块。本教程在这里展示了它的一个小小地绘图功能,读者就一下看到阿里巴巴“光棍节”的力量,难道还不能说明 matplotlib 的强悍吗?很可惜,matplotlib 的发明者——John Hunter 已经于 2012 年 8 月 28 日因病医治无效英年早逝,这真是天妒英才呀。为了缅怀他,请读者访问官方网站:matplotlib.org,并认真学习这个模块的使用。

经过上面的操作,读者可以用 dir() 这个以前常用的法宝,来查看 finace 所引用的 DataFrame 对象的方法和属性等。只要运用此前不断向大家演示的方法——dir+help——就能够对这个对象进行操作,也就是能够对该股票数据进行各种操作。

再次声明,本课程仅仅是稍微演示一下相关操作,如果读者要深入研习,恭请寻找相关的专业书籍资料阅读学习。