Research science

网站首页/科研机构

新财经综合实验室尹诗白教授指导的研究生刘鑫在顶级会议IJCAI2025发表论文

来源:新财经实验室  发布时间:2025-05-07

新财经综合实验室尹诗白教授指导的研究生刘鑫在顶级会议IJCAI2025发表论文

2025年4月29日,第34届国际人工智能联合会议IJCAI2025论文录用结果揭晓,西南财经大学计算机与人工智能学院新财经综合实验室关于多模态检索领域的论文《DUQ: Dual Uncertainty Quantification for Text-Video Retrieval》被接收,第一作者是学院2023级计算机科学与技术专业研究生刘鑫,第二及通讯作者是学院尹诗白教授,一作/通讯第一单位均为西南财经大学。

文本视频检索是多模态表征学习中最具影响力的应用之一,它基于文本查询,从海量视频数据中精准查找最相关的视频片段,极大推动了视频内容的传播。然而,单纯依赖文本与视频特征间的相似度来实现检索,往往难以满足实际需求,特别是当查询语句描述不够充分时,检索方法难以精准的检索到相应视频。为解决上述问题,该研究创新性提出了一种双重不确定性量化(DUQ,Dual Uncertainty Quantification)的检索方法,通过对内相似性不确定性模块(ISUM)增强对内多模态特征交互,对间距离不确定性模块(IDUM)增强对间多模态特征排斥,共同改进多模态特征间相似性计算的准确度,极大地提高了检索的精度(如图1所示),在6个文本视频检索基准数据集上测试表明,方法达到了SOTA的性能(如表1所示)。


1 DUQ模型架构
1
DUQ检索性能


背景介绍:
    International Joint Conference on Artificial Intelligence(IJCAI)是国际人工智能领域的顶级会议,被中国计算机学会(CCF)列为人工智能领域A类会议,其论文录用率常年保持在15%左右。IJCAI2025共有5404投稿(不包括desk reject),录用1042篇,录用率19.3%,每份论文至少有两名审稿人(平均3.7名),一名领域主席和一名高级领域主席进行审阅,确保每份投稿得到公正的评审。

    尹诗白教授长期致力于计算机视觉领域的科学研究,主要研究方向包括大视觉模型,多模态检索,图像复原,目标检测等,迄今为止以第一作者及通讯作者身份在中科院一区期刊及顶级会议上(如《Pattern Recognition》、《IEEE Transactions on Circuits and Systems for Video Technology》、IJCAI、AAAI)发表高水平论文20余篇。




TOP