打开量化投资的黑箱
Chap 3. 阿尔法模型
策略的设计
预测目标
- 信号强度/振幅
- 方向
- 置信度
投资期限
- 策略生效的周期范围
运行频率 (取决于投资期限)
- 被动周期性
- 高频:增加噪声和交易成本
- 低频:错失良机
- 主动性
- 主动信号
- 被动周期性
投注结构 (Portfolio)/选股
策略:- 绝对性:
- 基于未来
- 配对法(Comps),高风险,需要更多理解个股,灵活。
- 相对性:低风险,欠灵活,适合套利。
分组方法:
- 统计学挖掘
- 基本面直觉分组
- 绝对性:
投资范围
- 板块选择
- 市场选择:流通性
模型设定
- 超参数
- 可解释性
- online learning
条件变量(权重?)
- 修正型条件变量
- 止损,止盈
- 辅助条件变量
- GARP策略
- 修正型条件变量
混合型阿尔法模型
Chap 4. 风险模型
长期看来,风险敞口不会带来利润,但是它们随时会对策略的收益造成影响。更重要的是,宽客并不会试图去预测这些敞口,通常是因为它们无法成功地对此进行预测。
风险的不可预测性
通常,我们所能做的仅限于限制敞口规模或完全将其剔除。
惩罚函数 $$ y=x^{\frac{3}{4}} $$
度量风险
- 波动率
- Comps横截面标准差(cross-sectional standard deviation)
- 离散/相关性
- CVaR/VaR评估整体风险
模型类型:
- 经验型风险模型
- 理论驱动型风险模型
Chap 6. 投资组合构建模型
相等头寸加权
- 非等权重的问题:
- 由于线性,对于极值/噪声的不鲁棒
- 应对于不同信号使用相等权重
相等风险加权
- 风险平价
阿尔法驱动型加权
- 非线性信号,足够鲁棒
- 增加了风险乘数
决策树加权
关键公式对比:
阿尔法驱动权重:
$$ w_i = \frac{\alpha_i}{\sum \alpha_j} \times \text{风险调整系数}(VaR, 流动性) $$
非等权重信号加权:
$$ w_i = \frac{\text{信号强度}_i}{\sum \text{信号强度}_j} $$
投资组合最优化
MPT
- 风险调整收益
- 风险方差
- 期望收益
- 资产的期望相关系数矩阵
优化目标函数
- 期望收益
- 期望波动率
- 期望相关系数矩阵
Chap 8. 数据
市场
- 宏观/微观
- 股票/期货
- 时间粒度
价格数据
- 成交量
- 价格
- 时间
基本面数据
- 资产负债表
- 利润表
- 现金表
- 情绪
- 其他的创新数据来源(AI)
数据来源
- 第三方数据供应商
- 交易所
- 证监会
- 公司
- 新闻媒体
数据清洗
- 缺失数据
- 错误数据
- 单位
- 数值
- 除权
- 时间错乱
- 前视偏差是指在某些事情真实发生之前便错误地假设已经知道了相关信息
Chap 9. 研究
科学方法论:市场高度动态
- 假设
- 实验
- 观察
- 总结
检验:
- 累计盈利图
- 平均收益率
- 收益率随时间的变异性
- 波峰波谷间的最大降幅
- 预测力(R2)
- IC/IR
- 胜率或盈利时间占比
- 回报相对于风险的不同比率(sharpe, calmar, omega…)
- 与其他策略的关系(boost效果)
- 时间延迟
- 特定参数的敏感性(炒参数炼丹)
- 过拟合:节约型模型使用较少的假设条件,尽可能简洁地解释未来。大道至简
- 样本外检验(老生常谈,泛化能力和性能,dropout)
- 检验中的假设条件
Chap 10. 策略风险的内生性
模型风险:
结构关系变化风险:
- 全球流动性环境
- 风险偏好变化
- 量化机构共振平仓
外生冲击风险:
- 战争(热/冷)
- 监管
- 政府
蔓延风险和同质投资者风险: