量化投资
小张是后端工程师,工作 5 年,工资跑不赢北京房租。每月炒股凭感觉,越炒越亏。
去年他想:天天写自动化测试,能不能把交易策略也写成代码、跑回测、上线?他踩了一年坑才摸到门。
演示:小张的第一个量化策略
量化投资就是把交易策略当软件来开发——写代码、跑测试、上预发、灰度发布、监控告警。每个程序员都熟。
小张选了一个最简策略:周线均线突破。周 5 日均线上穿 20 日均线就买入,下穿就卖出。标的是沪深 300 ETF,本金 10 万。
步骤 1:选标的——沪深 300 ETF,不选小盘股
→ 为什么这么选:流动性大、数据干净、滑点低,新手回测最可信
→ 类比映射:等于挑一个稳定的成熟 API,不挑刚发布的 beta 版
步骤 2:定信号——5 上穿 20 买入
→ 为什么这么选:先做最简单可验证的版本,跑通再说
→ 类比映射:先写最小 demo,别一上来就微服务化
步骤 3:跑回测——2010 到 2024 共 14 年数据
→ 为什么这么选:跨牛熊周期才能看出策略真实性格
→ 类比映射:等于跑全量集成测试,不只跑单元测试
步骤 4:扣成本——每笔交易 0.2% 滑点加佣金
→ 为什么这么选:免费午餐先被市场吃掉
→ 类比映射:性能测试必须带真实网络延迟,不能假设零延迟
步骤 5:留 20% 样本外——2022-2024 数据不参与调参
→ 为什么这么选:用全数据调参等于背答案
→ 类比映射:测试集和训练集分开,机器学习铁律
最后结果:年化 9%、最大回撤 18%、夏普 0.6。比直接持有沪深 300 强一点点,扣完成本几乎打平。小张差点把电脑砸了——花一个月,跑出来基本等于躺平。
但这才是诚实结果。绝大多数公开策略的真实样子,就是平庸或微负。
拆解:5 步背后的 4 条规则
回看小张的 5 步,背后是 4 条规则:
规则 1:先做最小可验证版,再迭代复杂度
← 来自步骤 2:他没一上来上 50 个因子,从 1 条信号起步
边界:极简策略大概率不赚钱,目的是先打通流程
规则 2:回测必须扣回所有真实交易成本
← 来自步骤 4:不扣成本的策略数据都是漂亮废纸
边界:低频策略受成本影响小,高频策略可能直接转负
规则 3:永远留一份 “ 调参从没碰过 “ 的数据
← 来自步骤 5:这是检验策略是否真有效的唯一方法
边界:留太多数据用于验证会让训练数据不够,通常 20-30%
规则 4:用风险调整收益评估,不只看绝对数
← 来自步骤 1 选 ETF 而非杠杆品种:稳健胜过刺激
边界:风险偏好不同,长线资金看夏普,短线资金更看回报
易混点:高夏普 vs 真有效
| 维度 | 高夏普未必真好 | 真有效的标志 |
|---|---|---|
| 样本时长 | 1-2 年高夏普 | 跨过 3 个完整周期 |
| 实盘验证 | 只有回测数据 | 实盘走过 1 年以上 |
| 策略来源 | 网上抄的或反复调参 | 有清晰的赚钱逻辑 |
| 容量测试 | 只跑 100 万 | 跑过亿级真实流动性 |
类比一下:测试覆盖率 100% 不代表代码没 bug,可能只是测试本身写错了。
半练:小张的下一个场景
小张策略跑了一年。朋友甩给他一个 “ 火爆策略 “:加密货币网格交易。回测 6 个月,年化 200%,最大回撤 5%,夏普 8.5。问他要不要 all in。
问题:小张该看到的最大红旗是什么?
💡 先想 30 秒再展开。
回测时长 6 个月就是头号红旗。
- 6 个月覆盖不了一个完整周期,可能正好抓在单边涨势里
- 200% 收益配 5% 回撤太完美,违反风险收益对应的常识
- 夏普 8.5 在量化界是顶级机构传说级别——业余做出来概率约等于 0
- 经验法则:回测期 < 完整一轮周期,看到的都是幻觉
小张当年也差点上头。他做了对照实验:用同样 6 个月数据随机模拟 1000 次,发现 5% 的 “ 假策略 “ 也能跑出年化 100% 以上。这就是过拟合的真面目——把噪声当信号。
类比一下:等于一个新功能只在 dev 环境跑了一周,就要直接灰度全量——任何一个 SRE 看了都会拒签。
独挑:你的场景
你刷到一家量化私募的宣传:成立 3 年,年化 25%,最大回撤 8%,夏普 2.5。基金经理是某海归博士,最低门槛 100 万。朋友问你能不能投。
问题 1(闭合):这 3 年业绩(2022-2024)的最大盲点是什么?
问题 2(开放):你还会问哪些问题来评估这家私募?
问题 1 参考答案:这 3 年没经过真正的全市场杀跌。
2022-2024 是 A 股结构性行情,量化容易出业绩。没看到这家在 2018 单边熊市或 2015 急速崩盘里的表现,等于只跑过晴天的飞行测试。
3 年在量化界算 “ 刚够看 “,但远不到能下结论的长度。
问题 2 思考方向:不必有唯一答案,关键是看你能不能想到这几个维度:
- 资金管理规模和策略容量:太小没意义,太大可能打满流动性
- 策略原理是否能说清:说不清的别投,可能在裸跑
- 是否有存活者偏差控制:失败的产品会不会被悄悄关掉
- 实盘 vs 回测的差距:差距越大越可疑
- 团队稳定性:核心策略写手离职策略可能就死
- 是否经历过黑天鹅:去年没经历过的是 “ 还没到时候 “,不是 “ 扛得住 “
经验法则:把它当作面试一家技术公司——业绩报告是简历,你要做尽调。
扩展问答
1. 夏普比率到底是什么?
单位风险下的超额收益。公式:(策略年化收益 − 无风险利率) / 收益年化波动率。
它惩罚的是 “ 不稳定 “——同样赚 10%,平稳曲线的夏普高于过山车曲线。猛涨也算抖动。
经验对照:
| 夏普 | 含义 |
|---|---|
| < 0.5 | 不如躺平买指数 |
| 0.5–1 | 业余水平 |
| 1–2 | 合格,可拿出去募资 |
| 2–3 | 头部私募水平 |
| > 3 | 警惕:要么真神,要么数据有问题 |
| > 5 | 99% 是过拟合或诈骗 |
两个误区:夏普高 ≠ 安全(不抓尾部风险,LTCM 爆雷前夏普 4.x);夏普高 ≠ 赚得多(夏普 3 但年化 5% 也存在)。
2. 量化在 A 股能做吗?怎么做?
能做,但 A 股的硬约束决定了玩法和美股不同:
| 约束 | 影响 |
|---|---|
| T+1 | 当天买当天不能卖,股票日内高频死路一条 |
| 不能裸卖空 | 中性策略难做,融券池小且贵 |
| ±10% 涨跌停 | 极端行情下流动性蒸发 |
| 印花税 0.1%(卖出) | 高频被税收死 |
个人路径(从轻到重):
| 方式 | 门槛 | 适合 |
|---|---|---|
| 聚宽 / 米筐 / 优矿 | 0 元 | 入门、回测验证 |
| 券商 API(华泰 MATIC、东方等) | 几十万本金 + 会写代码 | 自己跑实盘 |
| 私募基金备案 | 团队 + 合规 | 机构化运作 |
A 股能做的几类(按主流度):股票多因子选股(私募 80% 在做)、指数增强、CTA 商品期货(不受 T+1 约束)、可转债 / ETF 套利、打新策略。
新手路径建议:聚宽免费学 → 券商模拟盘验证 → 实盘小钱跑满 1 年 → 加仓。
3. 量化交易费会很多吗?
取决于策略频率。新手最大的误解是把 “ 量化 “ 等同于 “ 高频 “。
A 股一笔交易的成本:印花税 0.1%(卖出)+ 佣金 万 1.5–万 3(双向)+ 滑点 0.05%–0.3%。一买一卖一轮约 0.2%–0.5%。
不同频率的成本拖累:
| 策略类型 | 调仓频率 | 成本拖累/年 | 可行性 |
|---|---|---|---|
| 长线价值 | 季/年 | 0.5% | 几乎可忽略 |
| 中频多因子 | 月度 | 3–6% | 主流私募档位 |
| 周线择时 | 周 | 10–15% | 必须 alpha 强 |
| 日内高频 | 分钟/秒 | 单边吃光 | 个人玩不了 |
个人在 A 股做高频几乎不可能:T+1 堵死股票日内、佣金谈不到机构价、印花税躲不掉。机构高频靠的是万 0.5 佣金、自营席位免印花、期货市场无 T+1、机房直连交易所。
新手做月度调仓的多因子,成本是小事。
4. 价值投资 Vs 量化投资,哪个更有道理?
不是对立关系,是两套工具。问 “ 哪个更有道理 “ 约等于问 “ 扳手和螺丝刀哪个更有道理 “。
两边都赚到过钱:巴菲特 60 年年化 ~20%,西蒙斯大奖章扣费后 39 年年化 ~39%。所以 “ 哪个更对 “ 是伪问题。
对个人的现实差异:
| 维度 | 价值投资 | 个人做量化 |
|---|---|---|
| 信息公平度 | 财报公开可读 | 高质量数据要花钱买 |
| 基础设施 | 一个手机一个券商 | 数据源 + 算力 + 低延迟通道 |
| 容量 | 几乎无上限 | 百万级还行,亿级 alpha 消失 |
| 心理压力 | 时间是朋友 | 连亏 3 个月时不知道该不该停 |
真正有道理的事是 “ 知道自己在赚什么钱 “:价值投资赚的是企业未来现金流折现 + 市场错杀的折扣;量化赚的是市场摩擦、行为偏差、统计规律。
最危险的姿势:价值派把 “ 长期持有 “ 当作不止损的借口;量化派把回测漂亮的策略当成印钞机。
程序员个人投资的一种参考姿势:80% 被动指数定投打底,20% 拿来玩量化或选股当学费——你不是巴菲特,也不是西蒙斯。
附录:核心术语速查表
| 术语 | 人话解释 | 类比 | 常见误解 |
|---|---|---|---|
| 因子 | 影响股价的特征 | 选水果看大小甜度 | 越多越好 |
| 回测 | 用历史数据验证策略 | 跑全量集成测试 | 漂亮就一定赚 |
| 夏普比率 | 单位风险下的收益率 | 性价比指标 | 越高越安全 |
| 过拟合 | 参数贴历史不贴未来 | 测试只覆盖 happy path | 只是参数太多 |
| 最大回撤 | 历史最深的下跌幅度 | 跌得最惨那次 | 等同于平均亏损 |
| 滑点 | 实际成交比预期差 | 标价 10 块买进 11 块 | 小钱可忽略 |
| Alpha | 跑赢市场的超额部分 | 比平均强多少 | 等于绝对收益 |
| 样本外 | 调参时没碰过的数据 | 留的最终考试卷 | 占比越多越好 |