[学位论文]
  • 张知奇
  • 湖南工业大学

摘要: 人类学习本质上是多模态的,因为联合利用多种感官有助于更好地理解和分析新信息。理所当然地,视觉语言模态学习从人类最为关键的视觉和语言两种模态融合学习过程的有效性中汲取灵感,在具有挑战性的任务中表现出了让人眼前一亮的能力,诸如跨模态检... 展开

作者 张知奇   授予学位单位 湖南工业大学  
导师 袁鑫攀 学位 硕士
学科 计算机科学与技术   国籍 CN
页码/总页数 1-82 / 82 出版年 2023
中图分类号 TP391
关键词 视觉语言   融合模型   跨模态检索   句法依存关系   文本嵌入  
机标主题词 融合模型;语义;依存关系
机标分类号 TP2;H030;F2
馆藏号 D03236984
相关作者
相关关键词