[ML 初探] 基于 SVM 的市场形态预测器研究 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mushroomqiu
V2EX    推广

[ML 初探] 基于 SVM 的市场形态预测器研究

  •  
  •   mushroomqiu 2016-08-25 11:19:27 +08:00 3813 次点击
    这是一个创建于 3344 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://uqer.io/community/share/5790ac2e228e5b9 …


    “ Market efficiency ”定义所选取的阈值为 0.199 。由上图可以看出,其标注符合预期。然后使用了比较简单的方法生成数据集。直接将 t 日过去 n 日的时间序列作为 feature ,其后一日 t+1 的市场形态标签作为 label , 以此对应数据集。这样的思路是利用过去 n 的收盘价用作 n 个特征维度,来预测后一天的市场形态。

    再利用 sklearn 中的网格优化在一定的参数范围内选取合适的模型。( PS : Grid search 的原理其实是参数遍历,并返回一个 grid score 字典记录每一组组合的结果。 这个原理很简单,可以通过遍历笛卡尔积来手动实现。但利用 sklearn 的好处是其模型内部做了优化,可以配置硬件,设置缓存大小及 CPU 核。)

    查看原文代码: https://uqer.io/community/share/5790ac2e228e5b9

    以上计算出了最优的 SVC 的模型及其 10fold 交叉验证的准确率(测试集准确预测的百分比)。
    观察可知,交叉验证的结果相近,因此理论上不存在过拟合问题。
    可通过设置大而密的网格,并借助硬件的力量,去训练得到性能较好的模型。
    此处交叉验证的平均准确率可近似为样本外回测,但不等同。原因在于:样本外回测时,要考虑样本的时间先后性;而交叉验证的结果并不考虑样本的时间先后性。

    总结
    1.可利用有监督的分类器尝试做一些离散的预测信号;
    2.对于离散的分类器模型,如 SVC , passiveAggressive, Decesion tree 等:若训练集无序,研究中最好通过交叉验证来验证有无过拟合;若训练集有序,研究中应尽量增大测试集的比例;
    3.若做实时策略模型,应尽量使用 online 的学习算法
    4.数据集生成中,特征向量的选取可以更加精炼并有所选择。特征选取可结合无监督学习、神经网络等方法。

    最后, 本文给出了研究机器学习模型的简单过程。真正实战,建议首先利用 offline 模型通过训练、优化、交叉验证对分类器的功能构想做验证,进而再开发 online 的实际策略模型,也许会更加清晰哦
    7 条回复    2016-08-29 10:29:06 +08:00
    nooper
        1
    nooper  
       2016-08-25 16:07:47 +08:00 via iPad
    震荡市最好的策略就是不操作
    hccbook
        2
    hccbook  
       2016-08-26 09:31:16 +08:00 via iPhone
    这广告……
    staticor
        3
    staticor  
       2016-08-26 14:42:46 +08:00
    对 sklearn 有兴趣的可以直接看 http://scikit-learn.org/stable/modules/svm.html

    这篇文章这么多字看得比英文感觉还吃力
    Borden
        4
    Borden  
       2016-08-26 22:48:23 +08:00   1
    卧槽,用 SVM 做预测不纯粹是伪科学跳大神吗?

    给一万个有男有女的人给机器学习,然后把第 10001 个人给机器看,让它判断这是男是女,这叫分类器。

    给一万个有男有女的人给机器学习,然后第 10001 个人不给机器看,让它猜这是男是女,这叫预测器。

    SVM 是分类器,不是预测器。这文章拿 SVM 做预测还能左手右手一个慢动作,整得跟真的似的,牛逼。
    grindsgears
        5
    grindsgears  
       2016-08-29 10:16:44 +08:00
    "使用沪深 300 指数 10 年的收盘价序列进行测试 " wtf
    这么低的精度,,,说白了,就是针对特定的 historical data 进行 optimize 。。不用这么复杂,就可以做一个 equity curve 一直往上和一直往下的两个 strategy 。 lol
    这种都是纸上谈兵的东西,,,,
    要么是针对 globe macro hedge trade 的那种, excel 就搞定,要么数据进度至少要包含 order book , foot print 之类的 hft 。。。
    这个东西弄完没有什么用,,市场的 liquidity 有多少? 到时候进不去,出不掉。。 lmaoooooooooooo
    102516949
        6
    102516949  
       2016-08-29 10:23:31 +08:00
    @Borden SVM 是可以做回归预测的,你可以参照李航的那本《统计学习方法》,或者周志华的那本《机器学习》
    quix
        7
    quix  
       2016-08-29 10:29:06 +08:00
    @Borden 但也可以这样啊, 给 10000 种走势,各种市场参数+ 结果(涨,跌) 给机器学习, 然后给 10001 种市场参数, 让机器分类是涨是跌, 对于结果有限情况下, 分类器就是预测期啦
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3747 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 00:50 PVG 08:50 LAX 17:50 JFK 20:50
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86