近日,伟德BETVLCTOR1946伍雪冬教授视觉机器人控制团队在人工智能领域顶级期刊Expert Systems With Applications上发表了21页长文“Discriminative target predictor based on temporal-scene attention context enhancement and candidate matching mechanism”。伟德BETVLCTOR1946研究生曹百亨、张先锋和马治伟及湖南大学王耀南院士为论文共同作者。
计算机视觉是人工智能领域的热门分支,针对现有深度学习下的视觉跟踪算法具有精度和实时性之间的冲突、上下文信息利用不够及跟踪噪声累积等问题,该团队提出了一种基于注意力特征增强与候选机制的深度视觉目标跟踪算法,主要创新点包括:提出了一种新的基于注意力机制的时间上下文增强模块,能从跟踪序列中提取稳健高效的时间上下文,并对注意力网络性质进行了理论分析;提出了一种前向传播网络结构,以克服场景信息提取和利用的困难,并对算法收敛性进行了证明;提出了一种基于候选选择机制的联合目标预测跟踪模块,以进一步提高跟踪精度和实时性。研究结果表明,与其它现有的21种最新先进跟踪算法相比,团队提出的新算法取得了很好的跟踪效果。
基于注意力特征增强与候选机制的深度视觉目标跟踪算法流程图
据悉,团队近期分别在人工智能领域期刊《Engineering Applications of Artificial Intelligence》(2023,https://doi.org/10.1016/j.engappai.2023.105901)和 《Applied Intelligence》(2022,https://doi.org/10.1007/s10489-022-03458-8)上发表了系列论文。
论文链接: https://doi.org/10.1016/j.eswa.2023.121400.