友情链接

首页 / 科学研究 / 学术交流 / 985数量经济与金融系列讲座 / 正文

数量经济与金融系列讲座419期: Deep Reinforcement Learning in a Monetary Model (深度强化学习在货币模型中的应用)

  发布日期:2025-04-09  浏览次数:

2025年4月9日下午,华威大学经济系助理教授陈明俐应邀在复旦经济学院做了题为Deep Reinforcement Learning in a Monetary Model (深度强化学习在货币模型中的应用)的报告,本次讲座由我院的王城教授主持,我院的杜在超、周晶、胡博、邱实等老师以及多位青年学者和一些学生参加了本次讲座。

陈老师首先介绍了研究的位置,这项研究处于经济学、宏观经济学中学习概念和机器学习中深度强化学习的交叉位置。传统的宏观模型一般采用理性预期假设。理性预期假设为模型求解提供了便利,一般作为思考的基准情况。但理性预期假设与个体在决策中的实际环境和行为模式存在明显差异,而有限理性则是一个更符合现实的假设。有限理性扩展了状态空间,在分析层面提供了更大的灵活性,具有更大的研究空间。

在方法层面,这项研究在“自适应学习个体”的基础上提出了“深度强化学习个体(人工智能个体)”的概念。这种个体不具有与经济结构相关的先验知识;利用深度人工神经网络,借助自身行动所引发的效用结果,学习决策规则。这种个体的行为符合一套可以简称为“SARS”的决策流程。给定t-1期的状态(State),个体做出决策(Action),行动后个体获得反馈(Reward)并修正自己的决策规则,最后依据转移规则环境达到t期的新状态(State)。陈老师和与会老师探讨了这样的决策流程可能包含的经济学含义。为了衡量有限理性相比于理性预期的偏离,研究定义了“一阶条件距离”和“稳态距离”两个指标。陈老师还和与会老师探讨了实际研究中可能出现的收敛问题。

在内容层面,研究的模型基于Leeper(1991)。积极的货币政策搭配消极的财政政策,或者消极的货币政策搭配积极的财政政策时,相应的理性预期均衡状态是确定的。“自适应学习个体”与“人工智能个体”都能学习均衡。积极的货币政策搭配积极的财政政策(或消极的货币政策搭配消极的财政政策),相应的理性预期均衡状态是爆炸式的(或不定的)。在这两种特殊情况下,只有“人工智能个体”可以学习均衡,这是因为“人工智能个体”更加灵活,不受到线性系统动态的限制。

与会老师就相关文献沿革和可能的发展进行了探讨,讲座在热烈的讨论中结束。

返回顶部