报告名称:From Probabilistic Testing to Certifiable AI: Large Language Models and Neuro-Symbolic Reasoning for Verifiable Autonomous Systems
报告时间:8月9日14:00
报告地点:理科大楼B211
腾讯会议:298 825 900(密码:101812)
报告摘要:
Learning-enabled Cyber-Physical Systems (LE-CPS), such as autonomous vehicles and drones, pose significant challenges for safety assurance due to the unpredictability of deep neural networks. Our FSE’22 and TSE’23 studies exposed critical gaps in industry testing practices, motivating new techniques for test reduction and scenario-based validation in autonomous systems. This talk highlights two recent vision-led directions. The FSE’24 vision revives model-based testing through Large Language Models (LLMs), already adopted in industry pipelines. Follow-up works in TSE’24 and ICSE’25 extend this to LLM-driven scenario generation and online testing for UAV autolanding. The FSE’25 vision, NeuroStrata, proposes a neurosymbolic shift from black-box learning to interpretable reasoning, enabling certifiable AI. This vision is now realized in a neurosymbolic perception module under real-world deployment with an Australian drone company, and has gained strong support across European institutions during my recent visit, including Oxford, Paris-Saclay, Hamburg, FSE’25, and CAV’25. Together, these efforts chart a path toward verifiable, certifiable AI for safety-critical systems.
报告人简介:
郑曦副教授于2015 年在美国德克萨斯大学奥斯汀分校获得软件工程博士学位,2024年获选为澳大利亚自然科学基金委“未来院士”(ARC Future Fellow),为当年全国唯一一位软件工程领域入选者。他现任澳大利亚麦考瑞大学副教授、智能系统研究组(ITSEG.ORG)主任、计算学院国际事务主任及软件工程副主任。2005 至 2012 年曾任澳洲 Menulog 公司首席解决方案架构师,具有丰富的产业与科研融合经验。郑副教授长期从事智能物理系统的测试验证、安全性分析、分布式学习、物联网与软件工程研究,已主持超 240 万澳元科研经费,包括 1 项 ARC 未来院士项目、2 项产学合作项目、1 项面上项目及多项 Data61 资助计划。他在顶级会议(如 ICSE、FSE、PerCom)发表高被引论文,曾获多项最佳论文奖,并荣获迪肯大学产业研究奖(2016)及麦考瑞大学青年研究者奖(2020 亚军)。他曾任 IEEE CPSCom 2021 及 Broadnets 2022 程序委员会主席,担任 Mobiquitous 2026程序委员会主席, 是《ACM 分布式账本技术》副主编、《可信智能环境》编委。2023年受邀担任 UCLA 与 UT Austin 访问教授,并共同创立国际研讨会 TACPS,推动神经符号与大模型在智能物理系统中的落地应用。他亦是 2026 年 Shonan 研讨会第 235 期与 Dagstuhl 研讨会(编号 202501048)联合组织者,两者聚焦大模型驱动的智能系统的合成、验证与可测试性。