如何快速上手使用python进行金融数据分析
引言:
本系列帖子“量化小讲堂”,通过实际案例教初学者使用python、pandas进行金融数据处理,希望能对大家有帮助。
【必读文章】:《10年400倍策略分享-附视频逐行讲解代码》
【所有系列文章汇总】:
第一步:好奇心
不要为了学习而去学习一门编程语言,或者任何工具。一定要心里首先有一个问题,抱着解决问题的心态,去了解并学习这个工具是如何解决问题的。驱动你去学习量化投资的,应该是你的好奇心。你认为你有一个炒股独家的窍门,你认为你发现了某个规律,你非常好奇的想用历史数据去验证你的想法。
比如我在大二的时候接触量化投资,就是因为我的好奇心。当时我看到一些入门的技术分析书上推荐kdj这个技术指标,说kdj低位金叉之后股票会涨,是个很好的买入信号,并且书上会配一些图,证明这个指标的有效性。我当时就很好奇,书上说的是不是真的?这几个配图是刻意挑选的还是有代表性的?是不是可以写个程序找出历史上所有的kdj金叉,看看之后涨的概率有多大?
这就是引领我入门的最初的好奇心。当时我不会编程,一开始用excel来试着验证,发现kdj从大概率上来讲是不行的。好奇心继续升级:我调整一下kdj默认的参数,效果会不会好一点?再配合一下其他的指标,效果会不会好一点?再加上点财务数据,效果会不会好一点......
慢慢的想测试的想法越来越多,excel渐渐的不够用,开始学习编程。我学习编程的目的性很强,就是解决我眼前的问题。对于解决我问题没有帮助的,我就先不学。一开始用的是sas,自己找书看,论坛上发帖子问。后来觉得sas太重,不灵活,慢慢的迁移到python。
我是金融专业的,但是学校并不教量化投资,一切都是自己学。可想而知,若没有好奇心一直引导我去探索,这么长的一段时间我怎么可能坚持下来呢?
第二步:为什么python
我推荐刚入门的量化投资研究者使用python。主要理由如下:
1. 适用性
python配合各类第三方的package(例如下面要降到的pandas),是非常适合用来处理金融数据的
2. 简单
相比于c,c#等语言,python容易太多了。让你可以更快,更方便的的对自己的想法进行测试。life is short, use python。
3. 全能
matlab是另外一个金融分析领域的统治级语言,以上讲的两点适用性、简单性matlab都是具备的,在业界的使用范围应该是比python要高的。
而python相比于matlab的一大优势,那就是全能。matlab基本只能用于金融数据分析。但是python除了拥有不亚于matlab的矩阵计算、科学计算能力之外,其他几乎任何事情都可以做。比如数据的清理、整理,比如从网页上抓取数据,比如进行文本信息的挖掘,比如做一个网站......现在学习一门语言,将来在任何地方都能用到。
第三步:如何入门python
如果你有其他语言的编写经验(比如上过一个学期的编程课),有一定的编程基础。以下三步可以让你入门python:
1. 随便找一本pyhton入门书。这些教程网上有很多很多,论坛里面也有很多,随便搜索一下就是。我稍微整理了下,放在附件中,回复可见。
2. 挑一本python入门书,不要花超过半天的时间,快速翻阅这本书。这个步骤不求记住什么东西,只要大概的知道这本书讲了什么,什么知识在这本书的哪一章写了就行,以便将来查阅。
3. 结合自己的好奇心,给自己寻找一个问题,简单的复杂的都可以,找一点数据(地址),直接开始实战。遇到问题,第一步是去翻书,第二步是去google(别去百度),第三步是论坛发帖求助。人大经管论坛、知乎以及其他平台都能够为你解决不少问题。
如果你没有任何编程的基础,那么想要入门python,也是以上三个步骤。但是第2步,就不是仅仅花半天的时间浏览书了,而是要细细的看书。对着书上的例子,实际的操作下,大概花一个星期的时间的业余时间也就够了吧。
第四步:如何入门pandas
使用python做金融数据分析,一定要用pandas。pandas是python的一个第三方库,简直是金融数据分析的神器,第一次遇到它的时候让我泪流满面。了解pandas最好的途径就是他的官方文档:,当然也可以看我之前写的系列文章。
之后会讲的内容:
【量化小讲堂 - python & pandas技巧系列】如何根据逐笔数据计算资金流入流出数据
【量化小讲堂 - python & pandas技巧系列】如何测试海龟交易法则
【量化小讲堂 - python & pandas技巧系列】详细介绍复权价格如何计算
对文章内容有疑问、需要python入门相关书籍的可以私信我或者留言,觉得文章内容有帮助的话,不要忘了点赞哦!