余俊教授是新加坡管理大学李光前经济学和金融学教授,于2012年被选为国际金融计量学会创会会士。其研究领域包括金融市场、计量经济学理论、资产定价等多个方面。余俊教授先后在Review of Financial Studies,Journal of Econometrics,Management Science,International Economic Review等国际学术顶级期刊发表了90多篇文章。至今,余俊教授发表文章的谷歌引用次数已经到达9214次。他发表的关于资产泡沫检验方法、估计泡沫发生时间和危机发生时间的文章,对很多国家的经济政策具有重大影响,其中三篇代表作的谷歌引用率分别达到1253次、1242次和678次。余俊教授同时担任国际权威期刊Journal of Econometrics,Econometric Theory, Journal of Financial Econometrics的副主编。余俊教授于2022年在复旦大学经济学院开设了时间序列相关的蒋学模经济学课程,为同学们讲授了应用于平稳和非平稳时间序列的经典模型。之后我们很荣幸对余俊教授在学术研究、方法建议等方面进行了专访。以下是采访的具体内容。
总策划:寇宗来
本期记者:王孜、唐雨桐
指导:王晓虎
审核:韦潇
执行:纪红梅
出品:学科与人才办公室
Q1:在这门短期课程中,您更多的从理论角度讲授了非平稳时间序列建模的问题。在接受到复旦经济学院的邀请后,您是从怎样的角度设计此短期课程的,通过这门课程想向复旦大学的同学们传递什么知识?
余俊:复旦大学经济学院培养了一批杰出的经济学人才,为中国和世界经济学的发展都做出了杰出的贡献。我感到非常荣幸能够受到复旦经济学院的邀请,在收到邀请后,我一直在思考通过什么样的方式可以使同学们的收获最大化。在与复旦大学经济学院的教授沟通后,我了解到同学们已经在时间序列模型及其在经济领域应用方面获得了很好的训练。但是,他们对模型的统计性质和参数估计的渐进理论知之较少。然而,统计性质和参数估计对于学术研究具有至关重要的作用。一方面这些理论工具提供了如何为给定时间序列选择最优模型的标准,另一方面它们协助研究人员进行合理的统计推断。基于此,我将课程的重心放在介绍时间序列模型的统计性质和参数估计的渐进理论两个方面。
Q2:从您的简历中看到,您的教育背景涉及中国、加拿大,现又任教于新加坡,请问这些不同的学术经历对您的研究思路有何影响?
余俊:我的教育经历不仅是涉及到不同的国家,也涉及到不同学科。我先谈一谈我以前在中国大陆时的学习背景。我本科是在武汉大学读数学系的计算数学专业。本科前两年是修一些数学基础课程,如数学分析、线性代数等。到了本科三、四年级开始学习专业课,比如用计算机求微分方程、线性方程组、函数极值的数值解等。这一时期我积累到了一些技术能力,但当时从未想过学习这些技术在实际生活中的用处。后来,我在大二暑假期间有幸读到了北京大学厉以宁老师和秦宛顺老师编写的《现代西方经济学概论》,这本书将一些经济学思想完全用数学形式表达出来,这让我意识到经济学是逻辑性很强、很严谨的一门学科。于是,我在武汉大学修读数学学位的同时又修读了经济学学位。后来,我去了加拿大西安大略大学读经济学博士。在开始读博士课程后不久,我意识到数学技巧是有帮助的,而我的数学是不够的。于是我又去了西安大略大学的统计系,和他们的博士生一起上课。在学习了他们的课程之后,我才决定要做计量经济学。随着研究越来越深入,我才发现之前本科学习的知识对我后来的学术生涯有很大帮助,所以我们在每个阶段都应该认真学习。我的第一份工作是在新西兰的奥克兰大学。在奥克兰大学的时候,我跟奥克兰大学的统计学家有一些合作。这些合作对我来说很有意义,让我接触到了一些新的思想和技术。后来,我在2003年底加入了新加坡管理大学(SMU),当时SMU刚刚成立。很自然地,我必须帮助建立SMU的博士生项目。博士项目建成后,我与许多优秀的博士生密切合作,大家取长补短,对我来说,这是一个收获的时期。
Q3:您的博士论文获得了加拿大西安大略大学经济学博士论文奖,请问您在博士阶段是如何确定研究内容及其可行性的?
余俊:我的博士论文是关于在时间序列模型中使用经验特征函数进行参数估计。从高中时代起,我就对三角函数有特殊的兴趣。在我的本科学习期间,我对傅里叶变换和拉普拉斯变换着迷。概率分布函数的傅里叶变换就是特征函数,因此概率分布函数和特征函数有一一对应的关系。人们自然期望能够通过经验特征函数进行统计推断。恰好我的博士生导师John Knight教授对特征函数和矩生成函数有很大的兴趣。他教我如何使用特征函数和矩生成函数进行参数估计。在我的论文中,我使用特征函数来估计几个时间序列模型,并发展了渐近理论。
Q4:我们很多同学的科学研究或多或少涉及到模型的推导,大部分同学反馈,当自己接触到一个新的研究领域时候,往往对涉及到的模型感到无从下手,即便在一定积累后能够做一些模型推导工作,也会对自己的推导是否正确产生怀疑。虽然我们从本科阶段就逐步积累了学习和使用数学工具的经验,但在研究中仍然不能很好的应用,您对同学们普遍遇到的这一问题可以给些建议吗?
余俊:本科阶段我主修计算数学,在学习新的模型时,除了常规的推导模型相关性质外,还会撰写程序,用模型产生一些随机数据,这让我更加直观的认识和了解模型。举例来说,我会自己编写从一个AR(1)模型产生随机数据的代码,通过设定不同的参数,生成一系列基于AR(1)模型的随机数据,然后绘制成图形。这一过程可以帮助你积累大量的经验,从而构建对模型更加具象的直观感受。这时,当遇到实际中的数据时,你往往会有一种感觉,即这种数据大概符合什么模型。因此,基于个人经验,我认为学习模型不应该停留在纸面的推导,而是需要给自己建立更加直观的印象,这或许是更加有效的学习方法。
Q5:您在计量理论和应用方面都做了大量的研究,请谈一谈您是如何发现可行的研究问题?
余俊:我既研究理论计量也研究应用计量。我其实做了很多时间序列方向的实证研究。对于理论计量经济学的问题,我只会选择具有清晰的实际应用价值的科研问题,所以我的文章一定有一部分是关于理论模型的实证研究。我研究的思路多半是从金融数据或者现象出发,找到一个实际生活中的问题,然后引出理论上的思考,尝试构建理论模型解决实际问题。在职业生涯初期,我在波动率建模方面做了很多工作。随机波动率模型是刻画资产价格波动的重要工具,引发了学术界大量的关注。鉴于此,我开始研究基于特征函数估计随机波动率模型的方法。虽然随机波动率模型的似然函数没有解析解,但是其特征函数具有解析解形式。后来,我关注到资产泡沫的研究问题并开展了一些研究工作,因为资产泡沫对于资产定价、金融稳定等方面具有重要的实际意义。目前,我又回到了波动率模型领域。
Q6:您提到您非常注重研究工作的实际意义,那么您主要是从哪些方面寻找具有实际应用价值的研究问题?
余俊:这实际是经济学直觉问题。经济学直觉源于日常生活,这一方面可以通过阅读新闻报纸观察社会现象,另一方面通过参加研讨会了解同行们的研究问题。举例来说,当时做资产泡沫研究时,我自己的感受是市场并不总是有效的,如果市场总是有效的,为什么市场中还存在大量的资产管理公司帮助我们管理资产。金融市场也具有周期性,在金融危机后先后会经历复苏和繁荣,然后又会经历泡沫破裂阶段,可能在大部分时间市场是有效的,但也会存在偶尔的失效。这就促使我思考是否可以构建有效的模型刻画市场失效的情况。当然,我们很多理论创新也是要站在前人的肩膀上。譬如,文献已经有系统的做法去检验市场的有效性,你可以用AR(1)模型检验是否存在单位根,如果是检验市场是否存在泡沫,就是检验AR(1)模型的根是否大于1。但是文献中提到在现实资本市场中,很难找到AR(1)的根大于1的情况,这与我们的认知就会有出入,因为我们时常观察到市场泡沫的存在。在时间序列模型中,往往你的时间序列数据越长模型的拟合效果越好,但是对于金融时间序列可能并不如此。如果实际的时间序列数据同时涵盖了金融危机和泡沫两个时期,利用AR(1)模型很难检测出根大于1的情形。鉴于此,我们当时考虑为什么不能利用滚动窗口的方法解决这个问题。Peter C. B. Phillips 和 Tassos Magdalinos(2007) 虽然从理论方面研究了资产泡沫的检验方法,但他们并没有进行实证研究。在他们研究工作的基础上,我们利用滚动窗口的方法验证了市场泡沫的存在性。并且,利用我们的研究方法,我们进一步发现很多市场都存在泡沫,譬如股票、房地产、石油、比特币等市场。
Q7:您在金融泡沫领域的研究工作引起了很多中央银行的注意,包括美国联邦储蓄银行、中国人民银行等。您可以谈一谈您与这些中央银行之间的合作吗?
余俊:我和Peter C. B. Phillips、Yangru Wu(2011)合作的论文发表后,引起了一些中央银行研究者的注意,并被一些中央银行邀请参加研讨会。第一个是新加坡金融管理局。鉴于我是SMU的教授,这完全在意料之中。在2010年底,我被香港金融管理局邀请就这一主题开设一个短期课程。在随后的几年里,我为美国联邦储备银行、韩国银行、法国银行、德国银行和IMF等举办了研讨会。国际货币基金组织还邀请我为全球中央银行家的培训设计一个关于该主题的课程。值得一提的是,Shuping Shi是在SMU读的硕士。她正在为她的毕业论文寻找研究课题。我建议她研究这个课题,Peter进一步建议她做滚动窗口回归。随后,她在澳大利亚国立大学写了关于这个主题的博士论文,提出了PSY多重泡沫检测技术。这一技术被圣路易斯联邦储备局用于设计美国房地产市场的早期预警系统。
Q8:之前您提到您现在已经关注到了中国房地产市场的问题,那么,基于中国市场开展泡沫检验方面的工作存在哪些不同以往的挑战?
余俊:前期来看,中国最大的问题就是数据的质量问题。后来,我们惊喜的发现有一些比较严谨的学者用房地产贷款数据创立了一些比较可信的城市层级的房地产指数。最近,我和Peter、还有曾在SMU读博士的Liu Yanbo合作,设计第三代泡沫检测方法。我们的想法是利用面板数据的额外信息来提高该方法的力量。我们已经将该方法应用于中国的房地产市场,并取得了一些丰硕的成果。我们发现,中国很多城市都存在房地产泡沫,并且这些泡沫的规模还不小。
Q9:从您近期的发表和工作论文中,我注意到您做了大量的关于金融资产波动率的研究,其中即涉及到经典的长记性波动率模型ARFIMA Model,也研究了近期得到文献关注的粗糙波动率模型(Rough Volatility Model)。能否请您介绍一下波动率研究的重要性和当前的研究前沿?您认为上述两类模型的区别和联系是什么?在实证研究中,我们怎么能够更加准确的使用这两类模型呢?
余俊:几年前, Jim Gatheral和Mathieu Rosenbaum的研究再次引起了我对波动率研究的关注。自从Ding, Granger and Engle (1993) 的研究开始,人们已经发现波动率具有长期记忆性。也就是说,波动率的自相关函数具有不可加性。如果使用ARFIMA(p,d,q)模型来拟合波动率,通常会发现基于各种估计方法所估计的记忆参数d均接近0.5,并且在统计上显著为正,其中包括两种半参数方法和两种最大似然方法。在Torben Andersen、Tim Bollerslev和Frank Diebold的一系列重要研究中,他们发现ARFIMA模型很好的拟合了股票和汇率市场的日已实现波动率数据(RV),并且估计的记忆参数d接近0.5。当使用具有长期记忆参数的ARFIMA(1, d,0)模型对RV进行预测时,发现它能够提供准确的预测。近几年来,基于Fractional Brownian Motion(FBM)的连续时间序列模型开始被用于对波动率的建模。Gatheral et al.(2018)发现当Hurst参数(H)为0.14时,fBm能够生成合理的波动率曲面,并且该模型可以出色的预测未来的RV。因为H<0.5时的fBm生成的样本路径比标准布朗运动更加粗糙,所以Gatheral等人将该模型称为粗糙分维随机波动率模型(Rough Fractional Stochastic Volatility Model, RSFV)。最近的一些研究工作如Wang, Xiao和 Yu (2023)利用Fractinal OU过程拟合日RV,同样也发现H约为0.1。这两支文献的实证结果似乎是相互矛盾的。原因在于接近单位过程的ARFIMA(1, d,0)在H=d+0.5的情况下弱收敛于Fractional OU过程。第一支文献中发现d约为0.5,而第二支文献发现H约为0.1,这意味着d约为-0.4,显然与第一支文献结果不符。为了解释这相互矛盾的实证结果,Shi和Yu(2022)采用现有流行的估计方法研究了长记忆性波动率模型和粗糙波动率模型的有限样本性质,使用了两种半参数估计方法(The Log Periodogram Regression Method 和The Local Whittle Method)以及两种最大似然估计方法(Time-Domain ML 和Frequency-Domain ML)。研究发现,当数据是基于接近单位根的ARFIMA(1, d,0)生成时,两种半参数方法会将d估计为d+1,即估计值d存在大于1的偏误。当d的真实值为-0.5时,也就是符合RFSV的d值时,半参数估计方法得到的d大约为0.5,这符合长记忆性波动率模型相关文献的结果。此外,如果是基于两种最大似然估计方法估计AR(1)模型的参数,其参数的有限样本分布表现出两种模式,一种表现为参数分布在(0, 0.5),另一种表现为参数分布在(1, -0.5)。这些结果表明,在估计接近单位根和根接近于零的ARFIMA(1, d,0)时,现有的估计方法都失效了。在Li, Philips, Shi和Yu的最新研究中,他们发现接近单位根的ARFIMA(1, d,0)与根接近零的ARFIMA(1,d+1,0)之间的差异性会随着相似参数的缩小而逐渐趋近于零。也就是说,这两个模型是非常接近的,很难区分开来(Weakly Identified)。这一结果解释了上述两支有关波动率的文献会为什么存在明显相互矛盾的实证结果,即长记忆性(Long Memory)和反持久性(Antipersistency)。这篇文章进一步提出了构建置信区间的方法。实证研究结果表明置信区间往往包含包含两个子区间,一个对应于长记忆性模型,一个对应于粗糙模型。
Q10:在您公开的工作论文中,我们注意您当前的研究还涉及到机器学习领域,作为理论计量方面的专家,您怎样看待当前经济学领域发表的大量机器学习方面的文章?在如今的大数据时代,您觉得理论计量应如何发挥自己的优势?
余俊:我个人认为机器学习方法能够很好地捕捉变量之间的复杂的非线性关系,这也就是为什么机器学习方法能够提供准确预测的原因。在计量经济学领域,一种有效的预测方法是构建预测组合。具体来说,没有一个模型可以完全刻画实际数据的生成过程,也就说没有一个模型是完全正确的。但是有些模型是有用的,至少帮助我们理解数据的某方面特征。在一些经济条件下,可能一些模型拟合的更加出色,但当外在环境转变时,可能另一些模型会表现更加优异。因此,如果我们将这些模型的结果组合起来,取长补短,毫不奇怪我们可以得到比单个模型预测更加准确的组合模型。在我当前的一个研究中,我们将组合预测的方法与机器学习方法相结合,利用组合预测的思想,将不同机器学习方法组合起来,试图构建预测结果更加精确的模型。相比于机器学习领域,我觉得计量经济学的发展更加完善。我相信很多计量经济学方法可以用于改善机器学习模型。
Q11:现在很多同在选择研究方向、明确研究动机、创新点等方面都有较大困难,请问您对此有没有什么好的建议?此外,您认为青年学者应该如何平衡论文的质和量呢?
余俊:我个人认为论文的质量远远比数量更重要。对于年轻学者来说,也许最重要的一项技能是能够提出一个有趣的、重要的问题。这需要良好的品味和广泛的知识。那么,这个就需要两方面的培养,一方面是技术,一方面是直觉。技术方面就是平时自己要去训练提高自己的专业技术水平,比如我之前提到的数学、统计知识和应用。另一方面就是培养好自己的直觉,直觉就需要我们多去观察身边发生的事情,多读报纸、杂志,多参加Seminar,看看别人如何提出问题,为什么这个问题很有趣也很重要。有了好的直觉就容易提出好的问题,好的问题加上好的技术就可以去更好的解决问题。