首页 / 专业学位 / 新闻动态 / 正文

实务课堂|陈学彬:深度强化学习在金融资产配置领域的应用

  发布日期:2021-11-01  浏览次数:

10月29日18:30,上海市金融专硕教指委实务讲座系列暨复旦大学经济学院第543期专业学位实务模块课程成功举办。四川大学经济学院文科讲席教授陈学彬教授应邀来到线上会议室,为金融专硕带来了主题为“深度强化学习在金融资产配置领域的应用”的讲座。本次讲座由复旦大学数字金融研究中心主任、金融专业硕士(金融科技方向)负责人周光友教授主持。本次线上讲座向全市金融硕士培养单位开放,来自上海市十余家金融硕士培养院校的350余位师生在线聆听讲座。

陈学彬,经济学博士、四川大学经济学院文科讲席教授、博士生导师、享受国务院特殊津贴专家、中国金融学会常务理事、中国国际金融学会常务理事、上海市信息学会副会长。曾任复旦大学金融研究院常务副院长、上海财经大学现代金融研究中心主任、国家自然基金管理学科评审委员、全国金融学硕士教学指导委员会委员、上海金融学会副会长。主要研究领域:货币理论与政策、汇率理论与政策、金融博弈分析、量化交易、神经网络等深度学习方法在金融交易和金融风险管理方面的应用研究。主持国家自然基金、社科基金等课题十多项,在《经济研究》、《金融研究》等刊物发表论文数十篇,出版专著十多部、教材十多部。

陈老师以人工智能机器人AlphaGo战胜世界围棋冠军,以及此后AlphaGo Zero通过自我对弈和训练打败前一版本的这两个例子,引入了“深度强化学习”这一主题。此次课程的基本内容分为三个部分:深度强化学习的基本原理、资产组合交易模型以及深度学习资产组合交易案例。

首先,陈老师讲述了深度强化学习的基本原理,它是以一种较为通用的形式,将深度学习的感知能力与强化学习的决策能力结合在一起的一类机器学习算法。“深度学习”是利用深度神经网络进行机器学习的一种方法,“深度”是相对于传统机器学习的“浅层学习”方法而言的。深度学习不仅是神经网络层数的增加,在算法上也做了修正,改善了传统神经网络的弊病。强化学习是指在与环境交互中不断学习的问题以及解决这类问题的方法,它的困境在于,很多实际应用问题的输入数据是高维的,算法需要根据它们来选择一个动作执行以达到某一预期目标,但这不同于二维表,迭代计算很难实现。解决思路有两种,一种是从高维数据中抽象出特征作为状态,然后用强化学习建模;另一种思路是用一个函数来逼近价值函数或策略函数。

深度强化学习就是将强化学习和深度学习结合在一起,用强化学习来定义问题和优化目标,用深度学习来解决策略和值函数的建模问题,然后使用误差反向传播算法来优化目标函数。深度强化学习的神经网络可以分为前馈深度网络、反馈深度网络和双向深度网络三类。

其次,陈老师介绍了深度强化学习股票交易模型。智能体是一个投资组合管理人,环境包括股票市场、期货市场、大宗商品交易市场等,可能还包括政策环境。智能体通过对环境的观察,得到交易价格、数量和各类财务指标、技术指标等宏微观数据,之后做出买入或卖出的投资决策,环境给予相应的投资损益奖励,这又会反馈给智能体,使得其不断调整行动,优化自己的投资策略。这一股票交易模型通过以python为代表的编程语言来实现,它有许多开源库可供使用。

最后,陈老师分别以单只股票择时择量策略和组合投资策略进行了案例演示。他总结道,金融市场是一个变幻莫测的市场,其影响因素众多,并带有较强的随机性。没有一种确定性的模型能够准确地描述这个市场的变化,也没有一种策略能够在此市场永远获胜。深度强化学习模型能够在与市场的持续交互中不断地学习,调整自己的策略,是应对这个变化多端的市场的可行方法之一,其多种方法和指标在多个金融资产市场具有广阔的应用前景,但模型训练和预测结果的随机性和不可完全重复性可能引发新的金融资产管理风险,需要引起重视和进一步完善。

最后的提问环节,陈老师针对提问内容进行了详细的解答,并耐心地补充说明了学习材料来源。

感谢陈学彬教授带来的“硬核”讲座,期待陈教授未来为同学们分享更多的精彩内容!

撰稿人:程海怡

修订人:缪炜

审核人:周光友,朱宏飞

返回顶部