典型的相关分析的论文
本文提出了一种新的多模态融合方法,旨在通过整合来自多个媒体的信息来产生最佳的决策。虽然过去的大多数多模态方法要么通过将不同模态的特征投射到同一空间,要么通过使用约束来协调每个模态的表示,但我们的方法借鉴了这两种观点。更具体地说,假设每个模态都可以由一个独立的深度卷积网络来处理,允许独立于每个模态来做出决策,我们引入了一个连接特定模态网络的中心网络。这个中心网络不仅提供了一个共同的特征嵌入,而且通过使用多任务学习来规范了特定模态的网络。该方法在4个不同的计算机视觉任务上进行了验证,并持续提高了现有的多模态融合方法的准确性
页:
[1]