客服热线:19932581850

基于多模态与Transformer注意力机制的高精度视线估计方法

次浏览
  • 详细信息
  • 成果简介
  • 成果亮点
  • 前景分析
成果名称: 基于多模态与Transformer注意力机制的高精度视线估计方法 关键字: 图像特征 , 图像 , 左眼 , 视线 , 卷积 , 面部 , 注意力 , fl , 估计 , fc 应用行业: 计算机、通信和其他电子设备制造业
高新技术领域: 电子信息技术 所在地: 江苏省 知识产权类型: 发明专利
知识产权编号: CN202311660193.9 成果体现形式: 成果属性:
成果所处阶段: 授权 成果水平: 国内先进 研究形式:
学科分类: 战略新兴产业: 新一代信息技术 课题来源:
第一完成单位名称: 南通大学 第一完成单位属性: 技术成熟度:
合作方式: 技术转让 交易价格(万): 6.00 所属十强产业:

本发明公开了基于多模态与Transformer注意力机制的高精度视线估计方法,包括眼部图像特征提取部分、面部图像特征提取部分、特征融合部分;针对眼部图像,通过膨胀卷积层进行卷积处理,并通过全连接层得到眼部特征。针对面部图像,采用预训练的VGG16网络作为基础,并结合空间注意力机制进一步增强对眼部的关注度,最终通过全连接层得到面部特征。在特征融合部分,采用的Transformer结构独立地增强多模态特征的内部表示。最后,通过融合注意力机制,根据多模态特征在视线估计中的重要性动态调整各特征,从而实现更为精准的视线估计。

  • 附件

联系方式

  • 联系人:

    王美娇

  • 联系电话:

    17332172210

  • QQ/MSN:

  • Email:

  • 通讯地址:

请填写以下信息

  • 联系人姓名:

  • 联系人电话:

  • 手机号:

  • 邮箱:

  • QQ:

  • 工作单位:

  • 地址:

  • 意向说明:

  • 取消 确定

    友情链接

  • logo图片

    专注专业

    资深行业经验,专业技术运作团队

  • logo图片

    信息保密

    专利或技术全方位严格保密,保证用户权益

  • logo图片

    快速转让

    依托大数据,精准对接需求企业,节约成本

  • logo图片

    一站式服务

    技术转让一站式服务,省心更放心