一、会议概况
报告主题:自然语言处理与表示学习
报告时间:2022年11月2日 14:30-15:30
报告地点:(线下)中北校区办公楼小礼堂
(在线)腾讯会议:291-530-702
主持人:兰曼 教授
二、嘉宾介绍
黄萱菁,复旦大学计算机科学技术学院教授、博士生导师,主要从事人工智能、自然语言处理和信息检索研究。兼任中国中文信息学会理事、中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、中国人工智能学会女科技工作者委员会副主任、AACL执委、EMNLP 2021程序委员会主席。近年来承担了国家重点研发计划、国家自然科学基金等多项课题,在国际重要学术刊物和会议发表论文200余篇,被引12000余次。曾获上海市优秀学术带头人、上海市育才奖、人工智能全球女性学者、福布斯中国科技女性、复旦大学十佳教师、复旦大学“研究生心目中的好导师”等多项荣誉。
三、内容介绍
自然语言通常指人类的语言,是思维逻辑的载体,交流沟通的方式,也是传承文明的手段。对自然语言的处理是人工智能的重要研究内容,被称为人工智能皇冠上的明珠。自然语言处理必不可少的基础步骤是语言表示学习,其目的是构建自然语言的形式化或数学描述,以便在计算机中表示自然语言,并能让计算机程序进行自动处理。早期的语言表示方法主要采用符号化的离散表示。近年来,深度神经网络广泛应用于自然语言处理,不仅在文本分类、序列标注、机器翻译和自动问答等许多任务中取得了超越传统统计方法的性能,而且能以端到端的方式进行训练,避免了繁琐的特征工程。报告的第一部分将介绍自然语言处理的基本任务、应用领域、研究历史和技术发展趋势;第二部分将从词语、短语、句子和句对等粒度介绍基于神经网络的语言表示学习方法,阐述如何将语言的潜在语法或语义特征分布式地存储在一组神经元中,用稠密、低维、连续的向量来表示,并从模型、学习等层面讨论神经语言表示学习的近期研究趋势。