第 1 章：跑通第一个策略

最新书稿已更新至 XQuant 量化课堂页。想阅读最新版官方书稿，请前往图书页。

前言里那张学习地图，从这一章开始，就会变成一次次的具体实验。在这一章里，你会把一个最简单的投资想法写成规则，交给 AI 跑实验，读懂结果，再亲手验证：漂亮结果到底靠不靠得住。

这一章有 7 个动手实验。你先从最简单的定投起步，把想法写成规则，再让 AI 写成代码（做），然后看它能不能赚钱（看）。接着给它加一条判断，让它稍微变“聪明”一点，再判断结果有没有变好（再做、再看）。最后逐个扫描参数，亲眼看到量化交易最常见的失效场景：实验里看着赚钱，换一段时间就不行了（疑）。

路线图

本章围绕 5 个问题，安排 7 次动手实验，外加一次总结，带你第一次走完整流程，路线如表 1-1 所示。

表 1-1 第 1 章路线图

节	内容	实验
1.1 最简单的量化策略长什么样？	从简单定投起步，拿到沪深 300ETF 数据，跑一次最朴素的每月固定金额买入回测	2
1.2 我的收益算好还是算差？	引入“基准”，和“什么都不做的买入持有”对比，看懂收益到底算好还是差	1
1.3 怎么才能赢过市场？	给定投加一条均线判断，看见“加判断”的双刃剑	2
1.4 找到“最优参数”就能盈利了？	逐个扫描 24 个均线参数，找历史收益率最高的“冠军”	1
1.5 过去能代表未来吗？	把数据切成训练 / 测试，看冠军参数到了新数据上是否真有本事	1
1.6 本章总结	把 7 个动手操作串成一条策略进化路径，完成第一次做、看、疑的完整流程	0

1.1 最简单的量化策略长什么样？

这一节先进入第一个环节：做。你会把策略写成规则，并让程序用历史数据跑一次实验。这个过程叫 回测（Backtest）：用历史数据模拟“如果当时按这套规则交易，结果会怎样”。回测不能预测未来，因为未来可能出现历史里没有出现过的情况。但它能先帮我们排除明显站不住脚的想法，也能让后面的“看”和“疑”有对象。

我们从最简单的策略开始：定投。没错，就是你可能在银行 App 上见过的那个“定期定额投资”。每个月发了工资，拿出固定的一笔钱买入，不看涨跌、不做判断，机械地重复。

定投能量化吗？当然能，“量化”只要满足两个条件就够了：规则明确 + 执行可重复。定投完全可以量化。

不过，我们定投的不是某只个股。个股，也就是单家公司自己的股票。我们定投的是 ETF（Exchange-Traded Fund，交易所交易基金）。你可以把 ETF 理解成一份“指数套餐”。我们选择的是沪深 300ETF，它把 A 股市场上规模最大的 300 家公司打包在一起，其中包括银行、白酒、新能源、互联网等各行各业的龙头。

所以我们的定投规则就是：每月第一个交易日，用固定金额（1000 元）买入沪深 300ETF。 没有任何判断，没有任何预测，不看新闻，不猜涨跌。就这么简单。

本章 7 个实验都写在同一个 notebook 文件 q1-strategy.ipynb 里。notebook 是一种交互式的编程文件，和普通 Python 代码不同，它可以把代码、图表和运行结果按步骤放在一起，方便你看到策略的探索过程。第一份 spec 会让 AI 帮你创建它，后面 6 份直接接着写，变量、函数、图都在同一个 notebook 里累积下来。

动手实验 1：获取历史数据

接下来是你的第一个动手实验：拿到沪深 300ETF 5 年的历史数据。我们一起把这份 spec 写出来。

第一段：上下文

我们刚装好环境，notebook 是空的，什么都还没做。上下文一句话说清：

上下文：学员已完成环境配置（Python 3.12 + 虚拟环境 + 依赖包已安装）。这是课程的第一个操作步骤。
📌 要点：上下文段交代“前提是什么”。AI 不知道你之前做了什么，要明示，否则它可能假设环境已有现成数据，跳过下载步骤。

第二段：任务描述

任务描述段要具体到一句话能说清。“获取数据”是反例：什么数据？什么时间？什么形式？q1-strategy.ipynb 是这份任务说明的交付物，它是一个 Python notebook 文件。

任务描述：在当前工作目录创建 q1-strategy.ipynb，获取沪深 300ETF（510300.SS）最近 5 年的历史日线数据并可视化。
📌 要点：关键事物要点名到 ID。“沪深 300”不够，因为 A 股有沪深 300 指数（000300.SH），也有跟踪它的 ETF（510300.SS、510310.SS、510330.SS）。AI 不知道你想要哪个。spec 里所有关键名词都要具体到不能再具体。

第三段：任务要求

这一段是步骤主体，AI 自由度最低的部分。我们规定四件事：

任务要求：

导入 yfinance, pandas, numpy, matplotlib.pyplot
跨平台中文字体 fallback 链：plt.rcParams['font.sans-serif'] = ['Arial Unicode MS', 'SimHei', 'STHeiti'] + plt.rcParams['axes.unicode_minus'] = False
yfinance 获取数据：投资对象 510300.SS、起始 2021-01-01、参数 auto_adjust=True, multi_level_index=False
数据存到变量 df，索引为 DatetimeIndex，列名含 Close

📌 要点：每个非默认参数都要点名。yfinance 默认会自动调整价格、用多级列名，这两个参数不写出来，AI 可能就会自行发挥，结果就会跟书里不一致。

有人看到 spec 里面还是出现了零星代码，担心自己写不到这么细。其实没关系。你以后写自己的量化策略时，可以分两步来：先和 AI 讨论想法，让 AI 帮你起草 spec；再把确认后的 spec 发给 AI，让它实现代码。此外，从第二章开始，我们会采用开源框架 open-xquant，进一步降低 spec 的编写难度。

第四段：验收标准

最后是“成功长什么样”，这是 spec 最容易被忽略也最重要的部分：

验收标准：

打印数据的前 5 行
打印数据时间范围（起始日期到结束日期）和总行数
画一条收盘价折线图，标题为「沪深 300ETF (510300) 收盘价走势」

📌 要点：验收标准要让 AI 跑完自己能说“对了 / 错了”。“画一张图”是反例，AI 可能画 K 线、画柱状图、画散点图。要明确到具体的 X/Y 轴、标题文字、变量名。

完整示例 spec 在配套仓库的 q1-how-to-profit/specs/spec-01-get-data.md，你可以参考。把你写好的 spec 复制到 AI 编程工具对话框里；如果出现授权弹窗，选「允许」。示例 spec 用了 Markdown 语法，比如 # 表示标题，- 表示列表，反引号用于标出代码。Markdown 不是必要条件，关键是把想法表达清楚，并且有一定结构。

AI 执行完毕后，你会在文件夹中看到一个新文件：q1-strategy.ipynb。第一次双击打开时，AI 编程工具会询问你使用什么 Python 内核。它的意思是：这份 notebook 要交给哪个 Python 环境来运行。这里选择“准备工作”中创建的 Python 3.12 环境，如图 1-1 所示。

选择 notebook 使用的 Python 内核

打开 notebook 文件后，你会看到代码被分成一个个单元格，从上到下排列。这个界面中有几个常用按钮，如图 1-2 所示。

单步运行：单独运行当前代码单元格。运行结果会出现在这个单元格下方。
全部运行：从上到下依次运行整个 notebook，直到全部完成或出现错误。每个单元格的运行结果会紧接着出现在代码单元格下方，错误信息也会显示在下方。
重新启动：重新启动当前选择的 Python 内核。通常，在 Python 环境中安装了新工具，或者更新了某个旧工具之后，需要重新启动。
当前 Python 内核：显示当前 notebook 正在使用哪个 Python 环境。

notebook 常用按钮

回到你的第一个成果上来，这时候你的 notebook 里应该出现了一张折线图和一些打印输出。AI 帮你做了这些事：从雅虎财经下载了沪深 300ETF（代码 510300.SS）从 2021 年 1 月至今的每日价格数据，打印了前 5 行让你看看数据“长什么样”，然后画了一张收盘价走势图，如图 1-3 所示。

沪深 300ETF 收盘价走势

读懂你的第一张图

看看这张收盘价走势图。

先看整体趋势：价格总体是在涨还是在跌？有没有明显的“大起大落”？你大概率会看到价格经历了几轮上涨和下跌的周期，不是一条直线往上走，也不是一路向下。

再看波动范围：最高点和最低点大概差多少？价格在什么区间内震荡？你会发现，波动幅度可能比你想象的大。这说明，同一只 ETF，不同时间点买入，结果可能天差地别，也正是我们要先用回测看结果的原因。

这说明什么？ 价格有涨有跌，波动是常态。你不可能总是准确地买在最低点、卖在最高点，没有人能长期稳定做到这一点。那有没有一种方法，可以不依赖“买在最低点”也能参与市场？定投就是这个思路。

有了数据，一个自然的问题就出来了：如果从几年前开始，每月固定买入一些，到现在是赚了还是亏了？ 我们来用历史数据回答这个问题。