
获取历史数据
历史数据存储跨资产类别的技术需求非常广泛。为了保持竞争力,买方(基金、支持部门)和卖方(经纪人/经销商)都在其技术基础设施上进行了大量投资。必须考虑到它的重要性。特别是,我们对及时性、准确性和存储要求很感兴趣。我们将在本书后面的章节中讨论数据存储。
在上一节中,我们建立了一个策略管道,允许我们根据自己的个人拒绝标准拒绝某些策略。在本节中,我们将根据自己对获取历史数据的偏好筛选更多的策略。主要的考虑因素(特别是在零售从业者级别)是数据的成本、存储需求和您的技术专长水平。我们还需要讨论可用数据的不同类型,以及每种类型的数据将给我们带来的不同考虑。以下讨论了一些可用数据的类型和我们需要考虑的关键问题。
基础数据
包括宏观经济趋势的数据,如利率、通胀数据、公司行为(股息、股票分割)、美国证券交易委员会(SEC)文件、公司账户、盈利数据、农作物报告、气象数据等。这些数据通常用于对公司或其他资产进行基本评估,即通过对未来预期现金流的某种方式。它不包括股票价格序列。一些基本数据可以从政府网站免费获得。其他长期历史基础数据可能非常昂贵。存储需求通常不是特别大,除非同时对数千家公司进行研究。
新闻数据
新闻数据通常是定性的。它由文章、博客、微博(“tweets”)和社论组成。机器学习技术,如分类器,经常被用来解释情绪。这些数据通常也可以通过订阅媒体免费或廉价获得。较新的“NoSQL”文档存储数据库旨在存储这种非结构化的定性数据。
资产价格数据
这是量化的传统数据领域,由资产价格的时间序列组成。股票(股票)、固定收益产品(债券)、大宗商品和外汇价格都属于这一类。对于股票等较简单的资产类别,通常可以直接获得每日历史数据。然而,一旦包括了准确性和洁净度,并且消除了统计上的偏差,数据就会变得昂贵。此外,时间序列数据通常具有重要的存储需求,尤其是考虑日内数据时。
金融工具
股票、债券、期货和更奇特的衍生品期权具有截然不同的特征和参数。因此,没有一种“一刀切”的数据库结构可以容纳它们。必须特别注意为各种金融工具设计和执行数据库结构。
频率
数据频率越高,成本和存储需求就越大。对于低频策略,日内的数据通常是足够的,对于高频策略需要tick级别的数据,甚至特定交易交易所订单簿数据的历史副本。为这种类型的数据实现存储引擎在技术上非常密集,并且只适合那些具有强大编程/技术背景的人。
基准
上面描述的策略经常会与基准进行比较。这通常表现为额外的财务时间序列。对于股票,这通常是一个全国性的股票基准,如美国的标准普尔500指数(S&P500 index)或英国的FTSE100指数(FTSE100)。对于固定收益基金,与一篮子债券或固定收益产品进行比较是有用的。“无风险利率”(即适当的利率)也是另一个被广泛接受的基准。所有资产类别都有一个受欢迎的基准,因此,如果您希望从外部获得对策略的兴趣,那么有必要根据您的特定策略对其进行研究。
技术
金融数据存储中心背后的技术栈非常复杂,它通常围绕数据库集群引擎,如关系数据库管理系统(RDBMS),如MySQL、SQL Server、Oracle或文档存储引擎(即“NoSQL”)。这是通过“业务逻辑”应用程序代码访问的,该代码查询数据库并提供对外部工具(如MATLAB、R或Excel)的访问。通常这种业务逻辑是用c++、Java或Python编写的。您还需要将这些数据存储在某个地方,无论是在您自己的个人计算机上,还是通过internet服务器远程存储。近年来,亚马逊(Amazon)网络服务等产品使这一过程变得更简单、更便宜,但要以稳健的方式实现这一目标,仍需要大量的技术专长。
可以看出,一旦通过管道确定了策略,就有必要评估特定历史数据集的可用性、成本、复杂性和实现细节。您可能会发现,有必要拒绝仅基于历史数据考虑的策略。这是一个很大的领域,确保定价准确和及时。不要低估为您的回测目的创建健壮的数据中心的困难!
许多回溯测试平台都可以自动地为您提供这些数据——当然是有代价的。因此,它将从您身上带走许多实现的痛苦,您可以完全集中精力于策略的实现和优化。像TradeStation这样的工具拥有这种能力。尽可能在内部实现,并避免将堆栈的部分外包给软件供应商。更高频率的策略,具有更吸引人的夏普比率,但它们往往与技术堆栈紧密耦合,在技术堆栈中,高级优化是至关重要的。
【交易学习】
【交易员洞察】
【基础知识】
【货币交易】
【黄金交易】
إخلاء المسؤولية: الآراء الواردة هنا تعبر فقط عن رأي الكاتب، ولا تمثل الموقف الرسمي لـ Followme. لا تتحمل Followme مسؤولية دقة أو اكتمال أو موثوقية المعلومات المُقدمة، ولا تتحمل مسؤولية أي إجراءات تُتخذ بناءً على المحتوى، ما لم يُنص على ذلك صراحةً كتابيًا.

اترك رسالتك الآن