关于量化交易,这些入门知识你需要了解,本文将向您介绍量化交易系统的一些基本概念。本文主要针对两类读者。第一类是想找一份量化交易员工作的求职者,第二类是想尝试开始自己的量化交易生涯的个人投资者。关于量化交易,这里是你需要了解的基础知识。
量化交易是量化金融中极其困难和复杂的领域。如果您想通过面试或构建自己的交易策略,您将需要投入时间学习一些必要的知识。
量化交易系统主要由四个部分组成:
策略识别:搜索策略,挖掘优势,确定交易频率。
回测:获取数据,分析策略表现,消除偏差。
交付系统:连接经纪商,自动化交易,最大限度降低交易成本。
风险管理:最优资本配置、最优投注或凯利准则、交易心理学。
我们先来谈谈如何确定交易策略。
策略识别
所有量化交易流程都始于初步研究。该研究过程包括搜索策略、测试其对您可能正在操作的策略组合的适用性、获取测试策略所需的任何数据,以及努力优化策略,使其预期年化回报更高和/或风险更低降低。如果您是“散户”交易者,您必须了解您的资金是否充足以及交易成本对您的策略的影响。
通过各种公开数据寻找盈利策略,其实很简单,并没有大家想象的那么困难。研究学者定期发布理论交易结果(尽管主要是总交易成本)。一些量化金融博客文章也详细讨论了策略。该交易日志还概述了基金经理使用的一些策略。
您可能会问,人们和公司如何愿意谈论他们的盈利策略,尤其是当他们知道如果其他人“复制相同的策略”时,从长远来看它最终会失败。
原因是他们通常不会透露他们使用的具体参数和调优方法,而这些优化技巧是将表现平平的策略转变为高回报策略所需的关键技术。事实上,创建您自己的独特策略的最佳方法之一就是寻找类似的方法,然后实施您自己的优化例程。
您看到的许多策略都属于均值回归交易策略、趋势跟踪或动量交易策略类别。
均值回归策略试图利用这样一个事实:“价格序列”(例如两个相关资产之间的价格差异)具有长期均值,而价格与均值的短期偏差最终会回归。
动量交易策略试图“抓住市场的趋势”,利用投资心理和大资金结构信息,向一个方向积累动量,顺势而行,直至其回归。
量化交易的另一个重要方面是交易策略的频率。低频交易(LFT)通常是指持有资产超过一个交易日的策略。相应地,高频交易(HFT)通常是指在一个交易日内持有资产的策略。
超高频交易(UHFT)是指秒级、毫秒级持有资产的策略。虽然高频交易和超高频交易对于散户投资者来说是可能的,但只有当您详细了解交易“技术堆栈”和订单簿动态时才有可能进行。在这篇介绍性文章中,我们不会深入探讨这些问题。
一旦确定了一个策略或一组策略,现在就需要用历史数据来测试其盈利能力,这就进入了回测的范围。
回测
回测的目标是提供证据,证明通过上述过程确定的策略无论应用于历史(训练)数据还是测试数据都是有利可图的。它反映了该策略未来在“现实世界”中的预期表现。
由于各种原因,回测并不能保证成功。这或许是量化交易最微妙的一个方面,因为它包含大量的偏见,我们必须尽最大努力去审视并消除它们。
我们将讨论几种常见的偏差类型,包括先睹为快偏差、生存偏差和优化偏差(也称为“数据窥视偏差”)。回测的其他几个重要方面包括历史数据的可用性和清洁度、真实的交易成本以及在可靠的回测平台上做出的决策。我们将在随后的“交付系统”部分深入讨论交易成本。
一旦策略确定,我们需要获取历史数据来测试,如果可能的话,改进策略。现在有很多数据卖家,他们有所有资产类型的数据。通常,数据的质量、深度和时间间隔不同,其价格也不同。
初级量化交易者(至少在零售层面)最初可以使用雅虎财经的免费数据。关于数据提供者,这里不再赘述。我想重点讨论处理历史数据时经常遇到的问题。
对于历史数据,人们主要关心数据的准确性或清洁度、幸存者偏差以及股利分配、股票分割等企业行为的调整等问题。
准确性关系到数据的整体质量,无论数据是否包含错误。有时错误很容易识别。例如,使用窄带滤波器可以找到时间序列数据中的“窄带”并对其进行纠正。其他时候,错误很难检测到,通常需要对来自多个数据提供商的数据进行交叉检查。
幸存者偏差通常是免费或廉价数据集的一个“特征”。对于具有生存偏差的数据集,它不包含不再交易的资产的数据。不再交易的证券代表已退市或破产的公司的股票。如果数据集包含这样的偏差,那么该策略在该数据集上测试时可能会比在“现实世界”中表现更好,毕竟历史“获胜者”已经被预先筛选并用作训练数据。
公司行为是公司进行的“逻辑”活动,通常会引发原始价格的阶梯式变化。不应计入价格预期的年化预期回报。公司的股利分配和股票分割是触发调整的两种常见行为。无论两者中的哪一个发生,都需要一个“回调”过程。我们必须小心,不要将股票分割与真正的预期年化收益调整相混淆。许多交易者在企业行动方面碰壁了!
为了进行回测,我们必须使用一个软件平台。您可以选择专门的回测软件(例如MultiCharts)、数值平台(例如Excel 或MATLAB)或完全自行实现的Python 或C++ 平台。对于MultiCharts(或者类似的平台),我是比较入门的,对编程的要求也比较低。
在做系统回测的时候,必须要定量的表达系统的性能。量化策略的“行业标准”指标是最大回撤与夏普比率。最大资本回撤代表一段时间内(通常是一年)账户资本曲线从波峰到波谷的最大跌幅,通常以百分比表示。
由于许多统计因素,LFT 策略的回撤高于HFT 策略。历史回测会显示过去最大的资金回撤,可以更贴切地反映该策略未来的资金回撤。第二个指标是夏普比率,它被启发性地定义为“超出预期年化预期回报的平均超额与超出预期年化预期回报的标准差的比率”。
这里,超额预期年化预期回报是指策略的预期年化预期回报超过预定基准的金额,例如标准普尔500或三个月国债(预期年化预期回报)。请注意,人们通常不使用历史预期年化回报指标,因为它忽略了策略波动性的影响,而夏普比率则考虑了这一点。
如果回测后,该策略的夏普比率很高,并且其最大回撤已经最小化,则可以认为是无偏的,下一步就是构建交付系统。
输送系统
交割系统是控制交易策略生成的交易列表的发送和经纪商的交割行为的方法的集合。事实上,交易可以半自动甚至全自动生成,而执行机制可以是手动、半自动(即“点击一次交付”)或全自动。
尽管如此,对于LFT 策略,手动和半自动技术更为常见;对于高频交易策略,必须创建全自动的交付机制。由于策略和技术相互依赖,因此它们通常与交易订单生成器紧密相连。
在构建交付系统时,我们需要考虑几个关键因素:连接经纪商的接口、交易成本的最小化(包括佣金、滑动点差和点差)以及实时系统和回测系统性能的差异。
联系经纪人的方式有很多种,您可以直接通过电话或通过全自动、高性能的应用程序编程接口(API)联系他。理想情况下,您希望交付交易尽可能自动化。这样,你不仅可以自由地专注于深入研究,还可以运行多种策略甚至高频交易策略(事实上,没有自动化交付,高频交易根本不可能)。
前面提到的常用回测软件,如MATLAB、Excel和MultiCharts等,都是LFT策略或简单策略的不错选择。然而,如果要做真正的高频交易,就必须构建一个用高性能语言(如C++)编写的内部交付系统。
让我告诉你我的个人经历。当我受雇于一家基金管理公司时,我们有一个十分钟的“交易周期”。我们每十分钟下载一次新的行情数据,然后根据这十分钟的信息进行投放。这里使用了优化的Python脚本。对于任何以分钟或秒的频率处理数据的工作,我相信C/C++ 更理想。
在大型基金管理公司中,交割系统的优化通常不属于量化交易员的工作范围。然而,在较小的公司或高频交易公司中,交易员是交付者,因此技术方面越广泛越好。如果你想加入基金管理公司,一定要记住这一点。您的编程技能并不亚于您的统计和计量经济学才能,但它们至少同样重要!
交付系统的另一个重要问题是交易成本的最小化。一般来说,交易成本由三部分组成:佣金(或税收)、损失和点差。佣金是支付给经纪商、交易所和证券交易委员会(或类似政府监管机构)的费用;滑点是您的预期交货价格与实际交货价格之间的差异;点差是指待交易证券的售价与实际交割价格之间的差额。购买价格之间的差异。请注意,点差不是恒定的,它取决于市场当前的流动性(即买入和卖出订单的数量)。
交易成本是决定策略是具有高夏普比率且高盈利,还是具有低夏普比率且极无盈利的策略的关键。根据回溯测试正确预测未来交易成本具有挑战性,您需要及时访问历史交易数据以及基于策略频率的卖价和买价信息。
为此,大型基金管理公司的整个量化交易团队都专注于交割优化。当基金管理公司需要卖出大量交易时(由于各种原因),如果大量股票“抛售”到市场上,价格就会被迅速拉低,甚至可能无法交割。最优惠的价格。
因此,即使遭受损失的风险,基金管理公式也会选择使用算法交易,通过“点滴”的方式在市场下单。此外,其他策略如果“抓住”这些必要条件,就可以利用市场失灵(并获利)。这就是基金结构性套利的内容。
交付系统的最后一个主要问题涉及策略的实时性能和回测性能之间的差异。这种差异是由多种因素造成的,例如前瞻偏差和优化偏差,我们在“回溯测试”部分深入讨论了这些因素。
然而,对于某些策略来说,这些偏差在部署之前不容易测量。这种情况在高频交易中最为常见。交付系统和交易策略本身可能存在程序错误,这些错误在回测时可能不会显现出来,但在实时交易时会造成麻烦。交易策略部署后市场可能会受到政变的影响,而新的监管环境、投资者情绪、宏观经济形势的变化也可能导致市场实际表现与回测表现存在差异,导致策略盈利能力下降。差异。
风险管理
量化交易迷宫的最后一部分是风险管理流程。风险包含了我们之前讨论过的所有偏见。它包括技术风险,例如交易所所有服务器上的突然硬盘故障。它还包括券商风险,例如券商破产(这不是危言耸听,引发恐慌的曼氏金融就是一个例子)。
总而言之,它涵盖了几乎所有可能干扰交易实现的因素,而且其来源各不相同。已经有完整的书籍介绍量化交易策略的风险管理,所以我不会详细说明所有可能的风险来源。
风险管理还包括投资组合理论的一个分支,称为“最优资本配置”,它涉及如何将资本分配到一组策略以及如何将资本分配到策略内的不同交易。这是一个复杂的领域,依赖于一些高等数学。
最佳资本配置和投资策略杠杆通过称为凯利准则的行业标准联系在一起。本文是一篇介绍性文章,这里不再详细介绍其计算。凯利准则对策略预期年化预期回报的统计性质做出了一些假设,但它们在金融市场上不一定成立,因此交易者在实施这些假设时常常持保留态度。
风险管理的另一个关键组成部分涉及处理交易者自身的心理因素。尽管每个人都承认算法交易在没有人工干预的情况下不太容易出现问题。如果交易者不小心的话,交易时可能仍然会出现许多认知偏差。
一个常见的偏见是厌恶回避。当一个人发现亏损已成定局时,它所带来的痛苦可能会麻痹这个人的行为,阻止他及时出售以止损。同样,人们可能会过早卖出以获利,因为他们太担心失去已经获得的预期年化回报。
另一个常见的偏见是所谓的偏好偏见:交易者过于重视事件而不是长期观点。此外,“恐惧与贪婪”这样的经典情感偏差当然也不能落下。这两种偏差往往会导致杠杆不足或杠杆过高,导致爆仓(账户资产净值接近于零甚至更糟)或利润缩水。
总结
从这个角度来看,量化交易是量化金融中一个有趣但极其复杂的领域。我只触及了这个话题的皮毛,文章已经这么长了!关于我在本文中简短讨论的问题,已经发表了大量相关书籍和论文。
因此,在申请量化基金交易职位之前,必须进行大量的基础研究。至少您应该拥有广泛的统计学和计量经济学背景,以及使用MultiCharts、MATLAB、Python 或R 编程语言的丰富经验。如果您正在处理更复杂的高频策略,您的技能可能还包括Linux 内核修改、C/C++、汇编编程和网络延迟优化。
关于量化交易,这些入门知识你需要了解,以上就是本文为您收集整理的关于量化交易,这些入门知识你需要了解最新内容,希望能帮到您!更多相关内容欢迎关注。