来源:统计学院

12月13日 | 林晓:无监督句子嵌入对比学习方法及其在文本数据分析任务中的应用

来源:统计学院发布时间:2023-12-10浏览次数:43

时   间:2023年12月13日13:30-15:00

地   点:普陀校区文科大楼A813

报告人:林晓上海师范大学教授

主持人:薛耀锋华东师范大学副教授

摘   要:

由于标记数据极其昂贵,无监督学习逐渐成为句子嵌入表示的主流方式。随着对比学习技术的发展,原型对比学习在该领域逐渐获得了重要地位。该技术结合了聚类学习和实例对比学习的架构,在无监督条件下进一步优化了语言模型的嵌入空间。提出了基于‘增强语义原型’的无监督句子嵌入对比学习方法,改变了仅使用‘正例’和‘负例’的传统对比学习框架。通过优化对比学习目标,模型在各种任务上取得了优越的性能,包括语义文本相似性、迁移学习和聚类。该工作通过Prompt方法创造性地构建了多样化的语义原型,可以在未来与特定领域相结合,在教育领域中也具有胜任多项繁琐的质性数据分析任务的潜力。

报告人简介:

林晓,现任上海师范大学信息与机电工程学院人工智能专业负责人,人工智能教育研究院副院长。教授,硕士研究生导师;2015年毕业于上海交通大学计算机科学与技术专业,获工学博士学位。

主要研究人工智能,图像视频编辑处理。作为负责人主持国家自然科学基金3 项,参与省部级项目8项,企业横向项目多项,并作为主要研究人员参与完成多项国家级理论研究项目;在国际或国内重要期刊上发表研究论文40余篇,其中第一作者发表在SCI一区期刊论文6篇;申请发明专利多项,4项获得授权;获得软件著作权6项;参与出版学术专著1部,参编教材1本。荣获2021年上海师范大学优秀教师称号;担任CCF-计算机辅助设计与图形学专业委员会执行委员, CSIG多媒体专委会委员,CAA智慧教育专业委员会委员,CSIG-动画与数字娱乐专委会委员、CSIAM-GDC专委会委员。