客服热线:19932581850

一种医学文档专业词汇自动化标注方法

次浏览
  • 详细信息
  • 成果简介
  • 成果亮点
  • 前景分析
成果名称: 一种医学文档专业词汇自动化标注方法 关键字: 标注 , 单词 , 向量 , 特征向量 , 标签 , 词汇 , bilstm , 文本 , 文档 , crf 应用行业: 制造业
高新技术领域: 先进制造技术 所在地: 天津市 知识产权类型: 发明专利
知识产权编号: CN201910265223.3 成果体现形式: 成果属性:
成果所处阶段: 授权 成果水平: 国内先进 研究形式:
学科分类: 战略新兴产业: 高端装备制造 课题来源:
第一完成单位名称: 天津科技大学 第一完成单位属性: 技术成熟度:
合作方式: 专利许可 交易价格(万): 2.00 所属十强产业:

本发明涉及一种医学文档专业词汇自动化标注方法,包括:对输入的医学文档进行数据预处理,得到预处理后的医学文档文本;获取词的字母级特征向量、单词级特征向量、语言特征向量并进行融合,作为词的编码向量;将分词后的医学文档文本的词标注分类得到标注数据集;对每一个词输出一个多维向量作为词的空间表示;获取增强后的标注数据集;进行训练建模,并最终输出标注结果。本发明设计合理,其采用半监督学习算法对大量未标注数据进行标注,成功地克服了现有医疗行业标注数据过少的缺陷,有效地提高了模型能够使用的数据量,并大幅提升算法对于关键词和专业词汇的标注准确率,可广泛用于医疗文献处理中。

  • 附件

联系方式

  • 联系人:

    苏博晖

  • 联系电话:

    15614431192

  • QQ/MSN:

  • Email:

  • 通讯地址:

请填写以下信息

  • 联系人姓名:

  • 联系人电话:

  • 手机号:

  • 邮箱:

  • QQ:

  • 工作单位:

  • 地址:

  • 意向说明:

  • 取消 确定

    友情链接

  • logo图片

    专注专业

    资深行业经验,专业技术运作团队

  • logo图片

    信息保密

    专利或技术全方位严格保密,保证用户权益

  • logo图片

    快速转让

    依托大数据,精准对接需求企业,节约成本

  • logo图片

    一站式服务

    技术转让一站式服务,省心更放心