学术动态
当前位置: 首页 > 学术动态 > 正文
中国科学院计算技术研究所王瑞平教授学术报告通知
发布时间 : 2025-04-11     点击量:

报告人:王瑞平

报告题目:视觉-语言多模态智能评测的探索

时间:202541615:00-16:00

地点:数学楼2-3

报告摘要:

   近年来物体识别、检测等视觉感知相关问题得到了较好的解决,面向视觉场景深度理解的视觉-语言多模态认知任务探索成为热点,因其涉及语言信息的理解、生成与推理等具有一定主观性的处理流程,相关任务的基准评测成为一个重要的问题。报告将介绍本课题组在多模态智能评测方面开展的初步探索及取得的一些具体进展,包括:面向图像描述生成的可学习评测指标HiFi-Score、面向视觉-常识组合推理的问答数据库CRIC、面向具身场景理解的动态环境问答数据库Env-QA、以及面向多模态大模型推理的多学科多语种评测数据库M4U等工作。

报告人简介:

   王瑞平,中科院计算所研究员、博导,研究领域为计算机视觉与模式识别,重点关注真实开放环境下的视觉场景理解问题。发表国际期刊和会议论文100余篇,Google Scholar引用9400余次,获授权国家发明专利9项。带领研究生6次获得本领域主流国际学术竞赛冠亚军,获得CVPR2021 CLVISION Workshop最佳论文奖。担任Pattern RecognitionNeurocomputing等国际期刊编委,十余次担任IEEE CVPRICCVECCVWACVACCV等国际会议领域主席,获得IEEE CVPR2019/ICCV2019/FG2019/ECCV2020/NeurIPS2020/ICML2022等国际会议杰出审稿人荣誉,先后在CVPR2015ECCV2016ICCV2019等国际会议合作组织并主讲Tutorial。研究成果获得2015年度国家自然科学奖二等奖(第4完成人)、2022年度中国图象图形学学会自然科学奖一等奖(第1完成人)、2019年度国家自然科学基金委优青项目资助。

邀请人:孟德宇教授

陕西省西安市碑林区咸宁西路28号     西安交通大学数学与统计学院

邮编:710049     电话 :86-29-82668551     传真:86-29-82668551