中文| EN

医工学院第26S014期学术报告 聚焦多模态大模型的幻觉抑制与视觉计数理论方法

作者:  来源:   阅读量:  发布时间:2026-06-01 10:41:06


2026年5月28日下午,医工学院学术报告第26S014期活动在顺德校区医工楼一楼学术报告厅举行。报告特邀西北工业大学计算机学院王鹏教授和华中科技大学人工智能与自动化学院陆昊副教授,分别作题为《多模态大模型的幻觉抑制之路:一公里还是一光年?》和《视觉计数理论与方法》的学术报告。学院方智文教授担任邀请人,师生积极到场参与,现场交流氛围活跃。

第一位讲者为王鹏教授,他长期从事空天智能感知、计算机视觉和机器学习等领域研究,具有深厚的学术积累和突出的科研影响力。他于2017年入选中组部青年人才计划,现任空天地海一体化大数据应用技术国家工程实验室副主任、陕西省科技创新团队负责人。多次带队参加国内外人工智能竞赛并获得冠亚季军,在Springer出版英文专著1部,在TPAMI、IJCV、ICLR、CVPR、ICCV、ECCV、NeurIPS、ICML、ACL等权威期刊和会议发表学术论文100余篇。

本次学术报告中,王鹏教授围绕“多模态大模型幻觉抑制”这一核心议题,系统解析幻觉抑制的演进路径与关键挑战。报告首先从多模态大模型幻觉的概念界定与形成机制出发,深入剖析数据清洗、RLHF、检索增强等工程化手段在降低幻觉率方面的作用,并论证其在提升模型可靠性的显著成效。在此基础上,报告进一步揭示了现有模型架构在跨模态语义对齐、细粒度视觉理解与复杂推理能力方面的局限,指出要从根本上缓解乃至消除幻觉问题,仍有赖于模型可解释性、因果推理等底层理论的突破。最后,王鹏教授结合多模态幻觉抑制面临的现实困境,展望从“概率拟合”迈向“可信推理”的技术发展方向,为深入理解多模态大模型的能力边界与可信应用提供重要参考。


在交流环节,与会师生围绕多模态大模型幻觉缓解等关键问题展开深入讨论,重点聚焦推理可靠性、知识增强机制、多模态模型安全性等前沿话题,并与王鹏教授进行了充分交流。现场交流深入,师生围绕幻觉缓解与模型安全等话题与王鹏教授进行了积极探讨。


第二位讲者为陆昊副教授,他的研究方向为计算机视觉与植物表型视觉。其在视觉和表型领域有十余年研究经历,在视觉领域的顶刊顶会TPAMI、IJCV、CVPR、ICCV、ECCV、NeurIPS等发表论文30余篇,在Plant Phenomics、Comput Electron Agric、ISPRS J Photogramm Remote Sens、IEEE Trans Geosci Remote Sens等植物表型和农业遥感领域国际权威期刊发表论文20余篇,4篇论文入选ESI高被引。谷歌学术引用6000余次,H指数为40。其是Plant Phenomics期刊编委、Frontiers in Plant Science期刊客座编委,是AAAI高级程序委员(SPC)、VALSE执行领域主席(EAC)、PRCV 2023领域主席(AC)。曾获欧洲农业工程协会杰出论文奖(2018)、2025全球麦穗语义分割挑战赛冠军、2021全球麦穗检测竞赛亚军、日内瓦国际发明展铜奖等荣誉,连续三年(2023,2024,2025)入选斯坦福全球2%顶尖科学家榜单,入选IEEE高级会员。

报告中,陆昊副教授围绕视觉计数的概念,从其发展脉络与基本内涵切入,系统分析了当前方法在面对不同目标类别、复杂背景、多尺度结构、动态变化及跨场景泛化需求时所存在的技术路径局限。报告重点介绍了团队在计数理论构建、视觉表征建模、多尺度特征学习、密集目标数量估计和跨场景泛化等方面形成的一系列模型方法与研究心得,并进一步探讨了视觉计数理论在医疗领域中的潜在应用价值与发展空间。


在交流环节,与会师生围绕模型能力评估、通用研究任务向专业化应用场景转化等关键问题展开了深入讨论,并与陆昊副教授进行了充分交流。现场讨论热烈,与会师生就模型评估与场景转化等议题与陆昊副教授展开了充分互动。


本次报告聚焦多模态大模型幻觉抑制与视觉计数理论两大前沿方向,内容涵盖幻觉概念界定、形成机制、缓解方法与未来发展方向等多模态大模型可信推理前沿问题,同时涉及计数模型构建、视觉表征学习、多尺度特征建模、密集目标数量估计与跨场景泛化等视觉计数核心议题。为学院师生理解多模态大模型可信推理与视觉计数领域的最新进展提供了系统视角,也进一步促进了生物医学工程与人工智能等交叉领域的学术交流与合作。

法律声明 | 学院位置 | 联系我们 | 友情链接

南方医科大学生物医学工程学院.版权所有

广东省广州市白云区沙太南路1023-1063号南方医科大学生物医学工程学院

邮编:510515 咨询电话:020-61648275