机器智能研究院最新研究成果被人工智能领域顶级会议 ICLR 2025、CVPR 2025录用

发布者:涂扬霓发布时间:2025-03-03浏览次数:31

       近日,机器智能研究院两篇关于“多模态大模型垂直领域迁移”,与“模型无关的在线领域自适应”的研究论文分别被人工智能领域顶级会议The 13th International Conference on Learning RepresentationICLR 2025)与The 43th IEEE/CVF Conference on Computer Vision and Pattern RecognitionCVPR 2025)录用。

1.       ICLR25论文(Oral排名21/11761):《Proxy Denoising for Source-Free Domain Adaptation

唐宋副教授为1作者,健康院22级硕士生苏汶芯为2作者,合作单位包括:汉堡大学、重庆大学、电子科技大学、萨里大学。上理工为第1完成单位

       该项研究首次在无源迁移(SFDA) 的背景下,系统地研究了如何将多模态大模型(如ViL模型)中异构通用知识迁移到垂直领域,创新性地从动力学的角度理解多模态大模型引导下的迁移学习过程,建立了基于多模态预测去噪的新迁移理论 (ProDe),包括:具有理论保证的代理去噪机制和互知识蒸馏正则化方法。实验结果表明: ProDeClosed-setParial-setOpen-setGeneralized SFDATTA等多种SFDA设定下均显著优于现有的最先进方法。

该项工作在最近Q-wenDeepSeek等大模型开源,以及信息安全成为AI应用刚性需求的大背景下,具有重要基础性意义,为多模态大模型的在个性化诊疗、专病治疗等典型垂直领域应用提供了全新的理论视角。


1. ProDe理论(左)与模型实例化(右)示意图

论文连接:https://openreview.net/pdf?id=FIj9IEPCKr

International Conference on Learning Representation是公认的人工智能、深度学习领域国际顶级会议之一,关注深度学习各方面前沿研究,在人工智能、统计和数据科学领域以及机器视觉、语音识别、文本理解等重要应用领域中发布了众多极其有影响力的论文。 ICLR2013年由深度学习领域两位巨头、图灵奖获得者Yoshua BengioYann LeCun牵头创办,获得了学术研究者们的广泛认可。在Google Scholar的学术会议/杂志排名中, ScienceNatureCell同处TOP 10阵列。ICLR 2025 录用率为32.08%,将于2542427日在新加坡国际会展中心举行,机器智能研究院将组队参会并做专题口头报告。

2.       CVPR25论文Domain Adaptive Diabetic Retinopathy Grading with Model Absence and Flowing Data

健康院22级硕士生苏汶芯为第1作者,唐宋副教授为第2作者、唯一通讯,合作单位包括:汉堡大学、耶鲁大学、北京协和医学院、四川艾尔眼科医院、电子科技大学、萨里大学。上理工为第1完成与唯一通讯单位

       该项研究针对真实临床的两个痛点(隐私保护,病患流式到达),提出“模型无关的在线领域自适应(OMG-DA)”新问题设定,聚焦一个新的研究点:是否能在所有模型信息不可知,且无任何标签的无监督情况下,仅通过改变数据概率分布,就能实现跨领域迁移。针对该问题,以糖尿病视网膜病变分级(DR Grading)为应用实例,研究团队创新地提出了生成式非对抗样本的数据迁移理论(GUES),并给出了基于变分自编码器(VAE)的具体实现框架。在4个开源的DR数据集上的实验表明:不论下游模型是否训练、输入样本规模如何变化,GUES都能显著地鲁棒提升模型的迁移性能。

该项工作为在最严格的信息安全限制下,提升低算力应用场景(如基层社区医院,救难、救灾等),响应跨机构、设备、人种等典型通用诊疗需求,提供了全新的高性价比思路;同时,也为数据的价值落地提供了技术可能性。


2. OMG-DA问题示意图(),基于生成式非对抗样本的数据迁移理论实现框架()

论文连接:https://arxiv.org/pdf/2412.01203

IEEE/CVF Conference on Computer Vision and Pattern Recognition是人工智能与计算机视觉领域顶级国际学术会议 (CCF A)。会议每年举行一次,代表了计算机视觉领域的最高研究水平。在Google Scholar的学术会议/杂志排名中, 位列计算机学科第1, 总榜第2 (1名为Nature)CVPR 2025 共收到13008份有效投稿,最终录用率为22.1%,将于202561115日在美国纳什维尔音乐城中心举行机器智能研究院将组队参会并宣读论文。