可以使用哪种机器学习算法来预测股市?


15

或者,预测外汇市场。我知道这可能会变得非常复杂,因此作为介绍,我正在寻找一种具有一定准确性的简单预测算法。

(这是为期四个月的硕士学位课程)

我读过多层神经网络可能会有用。有什么想法吗?另外,社交媒体的语义分析可以提供对影响股票市场的市场行为的洞察力。但是,语义分析目前不在项目范围内。


15
我的,但出于明显的原因,我将全部保留给自己!
babelproofreader 2012年

7
如果人们相信有效市场假说,就不可能始终获得高于平均水平的市场收益(没有内部知情者),这是当前利率/价格的基础。很多人不同意这一点,但几乎每个人都同意,对于散户投资者而言确实如此。换句话说,基于rand()的3线模型可能几乎与典型的投资者一样好:P
rm999 2012年

5
这似乎不太可能有人会愿意分享有一个算法任何超出样本精度。也许,除了一些出版的学术著作,其中的异常现象很小而且不包括交易成本。
NPE 2012年

2
对于学术工作,对价格进行建模而不是对其进行预测可能更有价值。预测可能会证明是不成功的,但是建模至少可以为事物的实际工作方式提供一些见识,并且理论上可以扩展到预测。
highBandWidth 2012年

2
@wayne我不认为这与过拟合有关,它是关于允许无法用于预测的预测变量,例如,在股票移动期间/之后发生的变量-如果您发现苹果和微软的股票倾向于相关,则不能使用此事实预测MSFT库存,但可以提供很多信息。
rm999

Answers:


17

正如babelproofreader所提到的,那些拥有成功算法的人往往对此保密。因此,除非您正在做一些聪明的事情,否则任何广泛使用的算法不太可能会非常有用(这时由于您添加了它,所以它停止了广泛使用)。

也就是说,了解自回归整数移动平均(ARIMA)模型可能是预测时序数据的有用起点。但是不要期望比随机结果更好。


5
+1:我读过几次书或者上过课,听过很多人相信,如果他们有一个足够复杂的算法,他们可以在股票/电力/商品市场上变得丰富。您尝试解释过度拟合等,但无济于事。据我所知,赫克不是内幕人士,成功的股票交易软件不依赖交易费用,套利和高速度。现在最前沿的是利用自动交易规则中的漏洞和高速投标/撤回出价来吸引其他自动交易者。
韦恩

1
另一个问题是,多个人最终会使用相同的算法,因为他们在完全相同的数据上进行了培训,然后进行了批量销售/购买。任何算法都有望具有长期准确性吗?
米歇尔

@Wayne有一些减少过度拟合的策略,尽管它们很难在时间序列数据上实现。
Zach 2012年

1
@Zach:是的,有一些方法可以对过度拟合进行惩罚,但这是我所反映的态度:在Excel中进行了一些基本(可能是错误的)曲线拟合的人,他们觉得自己可以用自己的秘密调味料来赚钱,但他们真正需要的是教授不会与班级共享的那些尖端,先进的算法之一。该算法将像手套一样适合数据,然后比使用Excel电子表格的所有其他投机者要好得多……但是这位教授一直在研究过度拟合和数据的局限性。叹。
韦恩2012年

12

我认为出于您的目的,您应该选择一种有趣的机器学习算法然后尝试一下。

关于有效市场理论,市场在任何时间尺度上都是无效的。另外,一些人(学术界和现实生活中的人)都受到智力挑战的激励,而不仅仅是为了快速致富,而且他们确实发表了有趣的结果(我认为失败的结果是一个有趣的结果)。但是,用少许盐处理所有阅读的内容;如果结果真的很好,也许他们的科学方法就不好了。

使用R进行数据挖掘可能对您有用。它很昂贵,因此请尝试在您的大学图书馆中找到它。第2章介绍了您想做的事,他使用神经网络获得了最佳结果。但请注意,他得到的结果很差,并且花费大量的CPU时间来获得它们。亚马逊的评论指出,这本书的价格要高出20美元,因为那一章提到了财务一词。当我阅读它时,给人的印象是出版商强迫他写它。他完成了作业,阅读了文档,仔细阅读了正确的邮件列表,但他的内心并不在意。我从中获得了一些有用的R知识,但不会因此而击败市场:-)


@Darren-我喜欢你的风格。
rolando2 2012年

1
可以在此处找到具有R数据挖掘的草案版本(2003年5月)。(我没有这本书,所以我不能说两个版本之间有什么
区别

@chi谢谢!我快速浏览了一下,那里只有四章中的两章。但是最大的不同是“ 预测股票市场收益”一章非常不同。没有提及xts或quantmod,而是使用ts包,并使用acf和MARS包进行预测。这几乎就像是奖金章节,我将花些时间正确阅读它。他仍在使用神经网络,但没有像出版的书中那样将它们与SVM进行比较。
达伦·库克

10

在我看来,任何能够执行以下所有任务的强大AI都可以轻松地产生具有统计意义的预测:

  • 收集并了解谣言

  • 获取和解释所有政府知识

  • 在每个相关国家/地区这样做

  • 做出有关以下方面的预测:

    • 天气状况

    • 恐怖活动

    • 个人的想法和感受

    • 影响贸易的其他一切

确实,统计分析是您最少的担心。


4

您可以尝试使用R中的auto.arimaets函数。rugarch软件包也可以取得一些成功,但是没有用于自动参数选择的现有函数。也许您可以从中获取均值模型的参数auto.arima,然后将其传递给rugarch并添加garch(1,1)

有各种各样的博客声称在此方面取得了一些成功。这是一个使用Arima模型(后来称为garch模型)的系统和一个使用SVM模型的系统。您会发现许多有关FOSS交易的好信息,尤其是当您开始阅读他的博客记录上的博客时。

无论您使用哪种模型,请务必进行交叉验证和基准测试!如果您发现一个Arima,ets甚至garch模型可以始终击败样本的天真的模型,我会感到非常惊讶。时间序列交叉验证的示例可以在此处此处找到。请记住,您真正要预测的是回报,而不是价格。


2

我知道至少一种对冲基金目前正在使用一种机器学习方法。numer.ai使用了一组用户提供的机器学习算法来指导基金的行动。

换句话说:对冲基金提供对数百种投资工具(最可能是股票)上加密数据版本的开放访问。成千上万的数据科学家等人针对该数据训练了各种机器学习算法,并将结果上传到记分板。得分最高的得分者会根据其结果的准确性以及在线获得结果的时间而获得少量收益。

最好的预测是由算法集合做出的。

因此,您有很多科学家提供经过训练的猜测,其中一些本身就是猜测的集合,而对冲基金使用所有提供的猜测的集合来指导其投资。

这个相当有趣的对冲基金的结果告诉了我两件事:

  1. 集成通常被认为是对股票市场进行预测的好方法。
  2. 好的预测需要更多的合奏,而不是我愿意建立的自己。

如果您想出去玩,请访问:https : //numer.ai/ 不,我不隶属于他们,如果我与拥有数千名员工的对冲基金建立联系,很可能不会在网上度过一天,但只支付可衡量的结果:)

numer.ai社区有一个论坛,他们在其中讨论他们的方法,以便您可以从尝试这样做的其他人那里学习。

我个人认为,拥有良好算法的人都会将其保密。


1

您应该尝试GMDH型神经网络。我知道一些成功的用于股票市场预测的商业软件包正在使用它,但是仅在文档的深度中提及它。简而言之,它是一个多层的迭代神经网络,因此您的方法正确。


0

我认为隐藏的马尔可夫模型在股票市场很受欢迎。要记住的最重要的事情是,您需要一种保留数据的时间方面的算法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.