活动回顾丨"沪上视觉·智海无界"——上海市计算机学会计算机视觉专业委员会2025学术年会圆满落幕

发布者：张宇发布时间：2025-06-25浏览次数：20

上海市计算机学会计算机视觉专业委员会第三届(2025)学术年会于2025年6月20日至21日在上海创智学院成功举办。会议主题为“沪上视觉·智海无界”。本次会议由上海市计算机学会、复旦大学主办，上海市计算机学会计算机视觉专业委员会（下简称专委）、复旦大学可信具身智能研究院、大数据学院、未来信息创新学院承办，中国图象图形学学会青年工作委员会协办。复旦大学姜育刚教授与同济大学赵才荣教授共同担任大会主席。会议的组织主席是复旦大学大数据学院付彦伟教授，未来信息创新学院陈涛教授，以及上海交通大学沈为教授。会议采用线下+线上直播的方式同步进行，线下参会150余人，线上直播累计观看16000多人次。

本次会议邀请了包括国家杰青、长江学者等国家高层次人才在内的30余位专家学者分享计算机视觉最新进展和思考，精心策划了10场大会特邀报告，以及“3G Gaussian”“视觉中的大模型学习”“青年学者服务”“赞助企业宣讲”等4场专题论坛，旨在共同探讨计算机视觉领域的最新科研成果与未来发展趋势。

大会合影

一、开幕式

6月21日上午会议开幕式隆重举行。上海市计算机学会副理事长兼秘书长薛广涛教授出席会议并致辞。他指出，计算机视觉作为人工智能的重要组成部分，已广泛应用于产业智能升级中。专委的设立与发展，不仅服务于上海地区人工智能高质量发展需求，也辐射长三角地区产业升级。他希望本次年会能为学界和业界搭建起高水平交流合作平台，助力产学研深度融合。

薛广涛教授致辞

随后，专委主任赵才荣教授代表专委致辞。他表示，本次年会的举办恰逢其时，为推动人工智能与计算机视觉领域关键问题的深入交流与探讨提供了良好契机。他从学术组织角度出发对专委会过去一年取得的成果表示肯定，并期待本次会议激发更多原创性研究与协同创新。

赵才荣教授致辞

此外，举行了2024年度专委“服务突出贡献奖”颁奖仪式，薛广涛和赵才荣教授为苏州大学曹敏、上海工程技术大学高永彬、上海交通大学刘笑宏、上海交通大学张宇伦、同济大学朱磊等获奖者颁奖。

专委“服务突出贡献奖”颁奖仪式

二、大会特邀报告

本次年会共设10场大会特邀报告，内容覆盖空间智能、多模态生成、三维视觉、可信AI、鲁棒图学习等领域。多位专家学者围绕视觉与人工智能的交叉前沿进行了深入阐述，为与会者带来一场高水平的学术盛宴。

上海科技大学虞晶怡教授作了题为《A Holistic Approach to Spatial Intelligence》的大会特邀报告。他围绕人工智能的本质进行了深入思考与探索，提出“representations（表征）、generation（生成）和understanding（理解）”是人工智能的核心要素，并就此进行了系统而详尽的探讨。

虞晶怡教授作大会报告

中国科学院计算技术研究所山世光研究员作了题为《多任务统一模型研究》的报告。他提出，视觉研究应从传统的模式识别迈向广义的世界模型构建，并深入分析和探讨了视觉生成与理解之间相辅相成的关系。

山世光研究员作大会报告

北京大学马思伟教授作了题为《三维视觉媒体表示与编码》的报告。他介绍了三维沉浸媒体技术及其应用的最新研究进展，重点讨论了三维视觉媒体的高效表示、编码技术的最新突破，并分享了其科研团队在过去几年关于沉浸媒体表示与编码的研究成果。

马思伟教授作大会报告

哈尔滨工业大学左旺孟教授带来了题为《可控视频生成与应用》的报告。他指出，尽管AI视频生成近年来发展迅速，但在可控性与应用拓展方面仍有诸多值得探索的空间。报告从提升视频生成的空间布局与动作可控性出发，探讨了视觉生成后处理增强方法，并以视频插帧与图像编辑为例，展示了视频生成先验在相关任务中的支撑作用。

左旺孟教授作大会报告

香港科技大学姚远教授的报告题目为《Towards Trustworthy AI: Recent Advances in False Discovery Rate Control》。他从统计控制角度出发，提出构建可验证、可置信的AI模型的新范式，引起与会者关注。

姚远教授作大会报告

南京大学郭延文教授带来题为《三维场景智能重建：构建数字孪生的基石》的报告。他指出，三维场景智能重建是连接物理世界与虚拟空间的核心技术，在数字孪生、智慧城市和智能制造中具有关键作用，为实现高精度环境建模与动态感知提供了重要支撑。

郭延文教授作大会报告

湖南大学刘敏教授的报告题目为《智能手术机器人多模态感知》。他分享了在手术场景下融合视觉、力觉、语音信号的系统架构及其实验系统，展示了AI在医疗中的深度渗透。

刘敏教授作大会报告

上海交通大学马超教授作《多模态场景理解与生成》报告。他介绍了跨模态对齐、多粒度生成控制等关键技术，强调了大模型在多模态场景语义表达方面的能力。

马超教授作大会报告

国防科技大学刘新旺教授线上分享了《攻与防：鲁棒图机器学习》的研究成果。他重点讨论了图学习模型在复杂场景下的安全性与鲁棒性问题，分享了从对抗攻击到防御优化的系统方案。

刘新旺教授作大会报告（线上）

中国科学院自动化研究所张兆翔研究员线上作《世界模型：重建、生成与推演》报告。他指出，世界模型作为智能体理解环境、模拟未来和规划行为的核心机制，正逐渐成为人工智能研究的重要方向，详细介绍了其团队在可学习的环境建模、跨模态推理以及物理世界规则显式建构方面的研究进展。

张兆翔研究员作大会报告（线上）

三、专题论坛

本次大会同时组织了专题论坛交流环节，来自学术界与工业界的多位专家学者围绕当前最具前沿性与挑战性的研究议题展开了深入研讨，激发了参会者对技术前沿的深刻思考，为参会者提供了一个深入交流、共谋发展的宝贵平台。

在6月20日全天的“3D Gaussian论坛”中，与会专家重点讨论了高效三维表示方法在图形渲染、场景重建和数字孪生等领域中的应用潜力。围绕“图形标准介绍与演进探索”、“基于生成式 AI的三维建模方法”和“三维高斯-点采样光场表达及其应用”等内容，嘉宾们分享了最新研究成果与工程实践经验。

6月20日下午举行了“视觉中的大模型学习”论坛，该论坛聚焦于大规模预训练模型在计算机视觉中的训练范式变革、跨模态能力构建以及通用性评估机制。论坛中，多位研究人员就“扩散模型驱动的具身智能”“面向开放场景下的目标重识别”“类人行为驱动的人形机器人全身技能学习”等议题展开了热烈交流。

上述两场专题论坛吸引了大量参会代表参与，现场气氛热烈，观点碰撞频繁，展示了当前三维视觉与大模型研究领域的蓬勃活力与前瞻方向。

在6月21日下午的青年学者服务论坛上，上海交通大学刘笑宏、华东师范大学谭鑫、苏州大学曹敏、上海工程技术大学高永彬、上海交通大学穆尧、西安电子科技大学杨旭、西北工业大学王文萱等七位优秀青年学者分享了各自的最新工作，内容涉及美学二维码生成、通用场景视觉理解、行人搜索、多模态学习等前沿课题，充分展现了计算机视觉领域新生代的科研潜力与创新思维。同时，邀请同济大学苗夺谦教授、上海交通大学杨小康教授、复旦大学薛向阳教授、北京大学马思伟教授、哈尔滨工业大学左旺孟教授、湖南大学刘敏教授分别做了深入的点评分析。