视觉-语言问题中的深层推理研究

发布者:季洁发布时间:2020-05-13浏览次数:267

吴琦,阿德莱德大学(澳大利亚)
主持魏忠钰,复旦大学
时间2020年5月15日(星期五) ,14:00-16:00
会议ID611 2341 3657
密码047382
摘要

视觉-语言(Vision-and-Language)问题是近年来非常热门的一个研究课题,这个领域内比较主流的问题有Image Captioning, Visual Question Answering 以及Referring Expression. 目前解决这些问题的主流方法基本是基于深度学习,依靠观察大量数据“记忆”出一个从输入到输出的对应关系。而我们认为这些问题的价值在于如何让机器懂得“推理”,这个报告中,我会通过介绍我们近期的几个工作,来阐述如何通过改变任务目标,模型架构,测试标准等方法,来真正体现视觉-语言问题中的深层推理问题与挑战。

讲者简介

吴琦,澳大利亚阿德莱德大学助理教授,澳大利亚国家杰出青年基金项目获得者 (Australian Research Council DECRA Fellow),澳大利亚机器人视觉研究中心(ACRV)vision-language课题组组长,澳大利亚科学院罗素奖获得者。吴琦博士于2015年在英国巴斯大学获得博士学位,致力于计算机视觉领域研究,尤其关注于计算机视觉-自然语言相关领域的研究。吴琦博士在CVPR,ICCV,ECCV,  AAAI, IJCAI, TPAMI等多个顶级国际会议和期刊发表论文四十余篇,吴琦博士亦担任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等顶级学术期刊会议审稿人。