个人做量化交易需要注意些什么?

Python051

个人做量化交易需要注意些什么?,第1张

一说到量化投资,一下子蹦出来一堆厉害的语汇,例如:FPGA,微波加热,高频率,纳秒等级延迟时间这些。这种全是高频交易中的语汇,高频交易的确是基金管理公司做起来较为适合,平常人搞起来门槛较为高。

可是,必须确立一点量化投资不相当于高频交易。买卖假如依据频率来区划的话,可分成:高频率:ticke纳秒等级的1s等级中低频:1s~2h等级超低频:1d~2w等长线投资高频交易对延迟时间,特性和可靠性规定十分高,必须很多的硬件配置的成本费和人力成本。

可是中低频买卖对硬件配置规定便会低许多。本人与基金管理公司差别关键反映在优化算法上,普通程序也是有工作能力捕捉到这一频率的买卖数据信号。老头子废话不多说,就一个字,立即干!假如要想剖析A股,或是BTC,就必须自身构建一套自然环境。

一般构建一个量化平台必须这种流程:设立账户〉开发工具构建〉数据信息提前准备〉量化交易策略开发设计〉回归测试〉模拟交易〉实盘买卖一、设立账户(这里忽略)

一、开发工具构建现阶段流行的两种服务平台是,python和R语言。这两个语言表达有给予回测架构,时间序列分析剖析,数据分析的库,(C+和java还可以,但是门槛相对性较为高)。

Python:现阶段应该是最广泛的本人量化分析技术性优选 语言表达,由于有关的开源框架非常丰富多彩。R:高级优化算法较为便捷,小区较为活跃性。我选择的是Python,常见的回测架构用的是ZipLine和BackTrader。

二、数据信息提前准备中国的股票数据,有一些服务提供商给予,例如通联数据、tushare;海外证券数据信息能够从得这种数据信息后就可以导到数据库查询去。有关数据库查询的挑选,一般应用Mysql,假如信息量较为大(>100G)能够应用mogodb,一般本人不容易这么大信息量。

三、量化交易策略开发设计说到买卖优化算法,通常会想到深度学习、马尔可夫实体模型、数据分析、深度神经网络、神经元网络等这种厉害的AI语汇,可是,一般游戏玩家基本上用不上。

针对一般投资者能够采用简易高效率的优化算法:

1、将自身实际操作和念头程序化交易,例如:三连阳,买低价股票或是你听闻过什么神奇的实际操作技巧全是用编码完成,随后应用历史记录开展回测。

2.传统式的指标值买卖:移动平均线,MACD,布林线指标等,蜡烛图基础理论,RSI,江恩理论。这种纯技术指标分析指标值必须在特殊的情景才可以有功效,大家都听闻过海龟交易法,很有可能都觉得挺有些道理的。但具体情况怎样,用A股或是外汇数据测试一下,便会发觉长期性回报率并不是特别好。

3.多因子选股票:每一个投资者都是有自身的选股票基础理论,例如有些人会看市净率,股票换手率,市净率,领域状况,交易量。这种挑选要素非常简单,但要是以好几千个股里去挑选,通常必须很多活力。程序流程就能特别好处理这种难题。如果你是高级玩家还可以试着一下高级优化算法。

例如深度学习,数据分析等。互联网大数据在金融投资行业运用或是处在逐渐环节。从现阶段信息内容看来,互联网大数据基金收益率的算是非常好,例如百度搜索和广发证券协作的百发指数型基金,腾讯官方和嘉实协作的互联网大数据股票基金。

四、回归测试假如回测实际效果非常好,回报率,最大回撤率,Sharp值,等指标值,都是在可接纳的范畴内容,你毫无疑问便会激动,急着要上真正买卖,乃至逐渐方案创立私募投资基金,可是,别着急,最好是模拟交易一下。

五、模拟交易但在实盘买卖前,还必须做一两个月模拟交易。许多回测实际效果非常好的对策不一定在模拟交易情况下就主要表现得好。历史记录是固定不动,回测的情况下能够根据持续调节主要参数,让各类指标值趋向极致,有时会造成优化算法过度拟合,由于销售市场一直千姿百态,太过于呆板的优化算法是没法融入销售市场转变。

模拟交易最后实际效果一般在于你的程序流程是不是灵便,是不是优良的风险性和资金分配优化算法。

总结:对于说本人做量化投资是不是可靠,上边的步骤早已表明了实际可策划方案,可靠性显而易见。对于能否赚到钱,就看本人的修为了更好地。

资料:《Statistical Analysis of Network Data with R》

语言R常见的网络分析包:

网络分析研究大部分是描述性的工作。

网络的可视化 即是一门艺术,也是一门科学。

三元闭包体现了社会网络的“传递性”(transitivity),枚举所有节点三元组中构成三角形的比值来表征。

网络的可视化和数值特征化是网络分析的首要步骤之一。

网络可视化视图将数据的多个重要反面整合在一个图表中。

该节点在多大程度上会与同类型或者不同类型的其他节点进行匹配,可以通过一种相关性统计量(所谓的同配系数)进行量化。

将复杂系统中感兴趣的问题与合适的网络概括性度量匹配起来,是网络特征化方法起作用的关键所在。

网络中的频繁子图模式

网络聚类系数的分布,用来检验社会网路的聚集性上

sand安装包

网络数据统计分析 statistical analysis of network data

在CRAN上

G=(V,E)

节点 :vertices 或者 nodes

边:edges 或者 links

节点数量:图的阶数 order

边的数量:图的规模 size

同构图 isomorphic

无向 undirected

有向 directed graph 或者 digraph

边:有向边 directed edges 或 弧 arcs

双向 mutual

小的图形用 formulate来创建

把mg转化为wg2

Zachary 空手道俱乐部网络 (karate club network)

数据集合实际上只存在两个社团,分别以教练为中心和以主管为中心。

Lazega律师网络可视化

srt() 不能用使用 upgrade_graph()d代替

DrL算法,针对大型网络可视化设计的布局算法。

节点的节点,即社区节点(主题节点)

即一个中心节点,一其直接相连的邻居,以及这些节点至今的边。

度值不同的节点以何种方式彼此连接

图的密度

全局聚类系数

局部聚类系数

互惠性 reciprocity

二元组普查

《R的极客理想——高级开发篇》(张丹)电子书网盘下载免费在线阅读

资源链接:

链接:https://pan.baidu.com/s/1WCZyrIsDcDz2aJRSoSRvrA

提取码:rgo6

书名:R的极客理想——高级开发篇

作者:张丹

豆瓣评分:6.8

出版社:机械工业出版社

出版年份:2015-7

内容简介:

【编辑推荐】

资深R语言用户多年实战经验的结晶,介绍R语言本身的核心技术以及R语言在不同领域的跨学科综合应用,借助每日中国天气的应用案例和游戏开发的案例,揭秘完整的R包开发流程,帮助读者创建自己的R包,打开R语言产品化的思路。

【内容简介】

R的极客理想”系列图书以作者多年开发经验为素材,系统地梳理了R语言的知识。在《R的极客理想——工具篇》中介绍了R语言的30多个工具包的使用方法,并以IT人的视角,告诉读者如何高效地使用第三方R包。

《R的极客理想——高级开发篇》则以R语言的高级编程为主,辅以跨界知识的综合运用。书中首先阐释如何用R语言实现数学、统计计算以及模型建立,应用包括协同过滤算法、基于矩阵的PageRank算法、遗传算法和金融交易策略模型等。详细介绍了R语言的环境空间、文件系统管理、S3、S4、RC和R6四种面向对象的程序设计。还介绍完整的R包开发流程,并提供每日中国天气的应用案例和游戏开发的案例,帮助读者创建自己的R包,打开R语言产品化的思路。

书中介绍了多个场景案例,不仅从学术的角度完成了模型设计,而且用计算机的方法把产品实现。通过案例的学习,可以让不同学科背景的R语言使用者,站在其他人的角度,找到新的思维方法。

《R的极客理想——量化投资篇》将介绍R语言在金融领域的应用,真正地让技术人员把自己的知识变成价值。

作者简介:

张丹,R语言资深用户,系统架构师,况客科技联合创始人(Qutke.com)。有10年IT程序开发和系统架构设计的经验,精通Java、R和Javascript三种编程语言,熟悉数据挖掘、统计和金融的多种算法。目前在互联网金融量化投资方向创业中,个人博客Alexa全球排名前10万。