首页 / 专业学位 / 新闻动态 / 正文

名家讲坛|邱锡鹏:大型语言模型MOSS:技术、实现与展望

  发布日期:2023-09-21  浏览次数:

2023年9月19日晚,复旦大学经济学院专业学位“名家讲坛”第67期如期举行。复旦大学计算机学院教授,担任中国中文信息学会理事、上海市计算机学会自然语言处理专委会主任邱锡鹏教授来到经济学院大金报告厅,为经济学院专业硕士研究生带来了“大型语言模型MOSS:技术、实现与展望”主题讲座。本次讲座由复旦大学经济学院院长助理朱宏飞副教授主持,报告厅内座无虚席,气氛热烈。

邱锡鹏,复旦大学计算机学院教授,担任中国中文信息学会理事、上海市计算机学会自然语言处理专委会主任等,主要研究方向为自然语言处理基础技术和基础模型,发表CCF A/B类论文80余篇,被引用1万余次,入选 “爱思唯尔2022中国高被引学者”。获得ACL 2017杰出论文奖(CCF A类)、CCL 2019最佳论文奖、《中国科学:技术科学》2021年度高影响力论文奖,有5篇论文入选ACL/EMNLP等会议的最有影响力论文,主持开发了开源框架FudanNLP和FastNLP,已被国内外数百家单位使用,发布了MOSS、CPT、BART-Chinese等中文预训练模型,在中文模型中下载量排名前列。曾获中国科协青年人才托举工程项目、国家优青项目、科技创新2030“新一代人工智能”重大项目课题等,2020年获第四届上海高校青年教师教学竞赛优等奖,2021年获首届上海市计算机学会教学成果奖一等奖(第一完成人),2022年获钱伟长中文信息处理科学技术奖一等奖(第一完成人)。

讲座伊始,邱老师以当下的热门话题ChatGPT为切入点,介绍了ChatGPT的49种应用场景以及发展路径,并简要阐述了ChatGPT背后的原理。“人工智能”就是让机器具有人类的智能,至今已有超80年的发展历史。早期模型都是所谓“弱人工智能”的模型,把每个模型训练出来,建立X到Y之间的映射,从而完成单个任务,而ChatGPT和早期模型的区别就在于,ChatGPT可称为Large Language Model大语言模型。

接下来,邱老师阐述了如何让大语言模型能够更好地理解人的指令。大语言模型的构建是一个复杂系统工程,好的语言模型需要更好地理解语言和常识。为达到这一目的,需要使模型具备情景学习(In-Context Learning)、思维链(Chain-of-Thought)、自然指令学习(Learning from Natural Instructions)等能力,且要能通过人类反馈对齐人类指令,实现从人工写答案到人工选答案,最后进阶到机器选答案的程度。此外,邱老师还介绍了实现大型语言模型HHH准则,即有用(Helpful)、诚实(Honest)、无害(Harmless),要求模型能快速有效地回答请求的问题,能提供准确的信息,不能输出具有冒犯和歧视性质的有害内容等。

讲座最后,邱老师全方位介绍了大型语言模型MOSS,它使用了含1000亿(mars)参数的模型,具有思维链、情景学习等涌现能力、可以直接和人类对话且根据人类反馈进行迭代优化,也能够与人类价值观、思维方式对齐。邱老师展示了部分与MOSS进行交互性问答的有趣案例,并对人工智能技术的颠覆性影响进行了展望。他认为,大型语言模型将加速通用人工智能的实现,未来人工智能或能模拟人类行为。在提问环节,同学们与邱老师进行了积极互动,邱老师对现场同学们提出的问题进行了深入浅出的解答。

至此,本场讲座在热烈的氛围中圆满结束,感谢邱锡鹏教授的精彩分享!

撰稿人:吴嘉仪

修订人:缪炜

返回顶部