联系我们

-电话:

55664251(本科生)

65643132(研究生)

65741490(学生党建)

65643970(就业/生涯发展)

65643131(三助/国际学生)

-Email:

econinfo@fudan.edu.cn(本科生)

econgraduate@fudan.edu.cn(研究生)

econcareer@fudan.edu.cn(就业/生涯发展)

地址:国权路600号复旦大学经济学院310室


首页 / 学生天地 / 经彩生活 / 学风建设 / 正文

数科赋能、世经领航:学科融合系列讲座 | 人工智能与大数据在量化投资中的应用及前景

  发布日期:2025-12-16  浏览次数:

12月9日下午,“数科赋能,世经领航:学科融合讲座系列”委员会有幸邀请到具有丰富海内外量化从业经验的张亮亮老师,为同学们带来了一场关于“人工智能与大数据在量化投资中的应用及前景”的深度分享。

作为从数学背景转型金融业界,历经卖方量化到买方实战的资深从业者,张老师结合自身经历,详细拆解了人工智能如何重塑量化投资的全流程,并展望了资产定价理论与机器学习融合的未来趋势。

量化投资的演进:从经验驱动到数据驱动

张老师首先回顾了量化投资的发展史,将其划分为几个关键阶段:

· 起源: 以 Markowitz 的均值方差模型为代表,聚焦资产配置和风险分散。

· 90年代(神仙打架): 物理学家、数学家涌入,多因子框架(如三因子模型)和统计套利兴起,主动量化管理开始发展。

· 2000年后: 硬件技术发展催生了程序化交易和高频算法交易。

· 2010年后(AI融合): 机器学习模型逐渐融入,量化投资从“经验驱动”向“数据驱动”转型 。

张老师指出,AI模型的引入带来了质的飞跃:它能够处理海量数据,利用非线性模型(如深度学习)逼近市场的非线性特征,并实现端到端的交易自动化。

多元数据的获取与处理:构建全息信息集

数据是量化投资的“燃料”。除了传统的结构化数据(量价、财务),张老师重点介绍了非结构化数据的应用:

· 另类数据: 卫星图像(如停车场车流、港口集装箱)、新闻舆情、语音文本(财报电话会、高管语调)等。

· 知识图谱: 利用图神经网络构建产业链上下游及公司间的隐性关联,这对于捕捉传导效应至关重要。

张老师还提到了数据预处理的关键步骤:

· 清洗与标准化: 处理缺失值和异常值,使用Z-score或Rank(排序)方法统一量纲,防止因数值差异导致模型梯度计算偏差。

· 降维:面对高维数据,使用PCA或 Autoencoder(自编码器)防止过拟合。

因子挖掘与预测模型:AI的深层渗透

在因子挖掘与收益预测环节,张老师详细解析了AI在此领域所展现的强大能力。

首先,在智能特征工程方面,传统方法依赖于经济逻辑来构建因子,而如今借助遗传算法、神经网络等工具,机器能够自动从市场中挖掘出统计因子或非线性因子。同时,重要性评估方法也得到了更新——通过XGBoost等树模型可以输出因子的重要性排序,从而替代了过去单一的信息系数评估方式。

其次,预测模型经历范式转变。市场本身是一个复杂的非线性系统,传统线性回归在应对高阶交互项时极为吃力,而神经网络(根据 Universal Approximation Theorem)理论上能够逼近任何非线性函数,为建模提供了更强有力的工具。在模型选择上,主要分为两种思路:一是截面预测,侧重于分析相对价值,即探究为何股票A比股票B表现更优;二是时序预测,关注绝对价值,利用LSTM、Transformer等架构来捕捉时间序列中的长期依赖关系与注意力机制。

不过张老师也指出,实战中仍面临显著挑战。市场的分布是时变的,且“历史只有一条路径”,这使得训练一个完美的定价函数极具挑战性。

投资组合优化与交易执行

在投资组合优化与交易执行方面,张老师进行了深入剖析。首先是组合优化环节。尽管均值方差模型作为经典理论广为人知,但在实战应用中,其稳定性往往不及简单的等权模型,且容易出现极端权重配置的问题。为此,业界提出了多种改进方案,例如引入贝叶斯方法(如Black-Litterman模型)以提升模型的稳定性,或设置严格的约束条件,如行业中性、控制风格偏离以及对个股权重设置上限等。此外,前沿探索方向之一是运用强化学习,该方法非常适合解决多期动态规划问题,尽管目前在业界的成功案例尚不多见,但其处理市场反馈和长期回报的能力极具潜力。

其次是智能执行方面。在算法交易中,利用 AI 进行智能拆单,降低市场冲击成本;利用高频快照数据(Snapshot)分析订单簿,优化成交价格。

未来趋势:资产定价理论与机器学习的融合

最后,张老师对2018年至2025年的研究趋势进行了梳理,提出了几个令人兴奋的方向:

第一,理论与数据的结合。 类似于物理学中的 PINN(物理信息神经网络),未来的方向是将资产定价理论(因果逻辑)嵌入到机器学习模型中,实现“人机结合”。

第二,多模态融合。结合结构化与非结构化数据,利用大模型处理复杂信息。

第三,跨资产联动。利用大模型捕捉股票、债券、大宗商品、外汇之间的隐形联动和传导机制。

提问环节

Q1:模型大概多久需要更新一次?

张老师: 从研究层面看,更新是每天都在发生的,源于对新技术的追求和对亏损的恐惧。但在实盘层面,更新模型需要经过严谨的回测和较长时间的实盘跟踪(数月甚至半年),确认新模型优于旧模型后才会替换。这是一个谨慎且耗时的过程。

Q2:截面信号(选股)和时序信号(择时)应该如何结合?

张老师: 简单加权是一个起点,但未必最优。更高级的方法是构建一个融合网络:利用 LSTM/Transformer 提取时序特征,利用图神经网络(GNN)或截面回归提取截面特征,将两者并行输入网络进行联合训练,即“面板数据”的处理思路。

Q3:如何利用大模型做跨市场的宏观分配?

张老师: 这是一个非常前沿且有难度的方向。大模型能够处理海量信息,这是人脑无法比拟的。虽然目前尚未有成熟的定式,但利用大模型去理解复杂的跨资产传导机制(如股债跷跷板、商品与股票的联动)是绝对值得探索的未来方向。

量化投资的本质是在不确定性中寻找确定性。从早期的线性模型到如今的深度学习与大模型,工具在变,但对市场规律的探索永无止境。正如张亮亮老师所言,在这个领域,我们需要拥抱 AI,但也需要保持对金融逻辑的敬畏,探索“数据驱动”与“理论驱动”的完美平衡。




返回顶部