视觉-语言问题中的深层推理研究

发布者：季洁发布时间：2020-05-13浏览次数：267

讲者	吴琦，阿德莱德大学(澳大利亚)
主持	魏忠钰，复旦大学
时间	2020年5月15日(星期五) ,14:00-16:00
会议ID	611 2341 3657
密码	047382
摘要	视觉-语言（Vision-and-Language）问题是近年来非常热门的一个研究课题，这个领域内比较主流的问题有Image Captioning， Visual Question Answering 以及Referring Expression. 目前解决这些问题的主流方法基本是基于深度学习，依靠观察大量数据“记忆”出一个从输入到输出的对应关系。而我们认为这些问题的价值在于如何让机器懂得“推理”，这个报告中，我会通过介绍我们近期的几个工作，来阐述如何通过改变任务目标，模型架构，测试标准等方法，来真正体现视觉-语言问题中的深层推理问题与挑战。
讲者简介	吴琦，澳大利亚阿德莱德大学助理教授，澳大利亚国家杰出青年基金项目获得者 (Australian Research Council DECRA Fellow)，澳大利亚机器人视觉研究中心（ACRV）vision-language课题组组长，澳大利亚科学院罗素奖获得者。吴琦博士于2015年在英国巴斯大学获得博士学位，致力于计算机视觉领域研究，尤其关注于计算机视觉-自然语言相关领域的研究。吴琦博士在CVPR，ICCV，ECCV, AAAI, IJCAI, TPAMI等多个顶级国际会议和期刊发表论文四十余篇，吴琦博士亦担任TPAMI，IJCV，TIP，CVPR，NIPS，ACL等顶级学术期刊会议审稿人。