联系人姓名:
联系人电话:
手机号:
邮箱:
QQ:
工作单位:
地址:
意向说明:
免费查询
一种医学文档专业词汇自动化标注方法
成果名称: | 一种医学文档专业词汇自动化标注方法 | 关键字: | 标注 , 单词 , 向量 , 特征向量 , 标签 , 词汇 , bilstm , 文本 , 文档 , crf | 应用行业: | 制造业 |
高新技术领域: | 先进制造技术 | 所在地: | 天津市 | 知识产权类型: | 发明专利 |
知识产权编号: | CN201910265223.3 | 成果体现形式: | 成果属性: | ||
成果所处阶段: | 授权 | 成果水平: | 国内先进 | 研究形式: | |
学科分类: | 战略新兴产业: | 高端装备制造 | 课题来源: | ||
第一完成单位名称: | 天津科技大学 | 第一完成单位属性: | 技术成熟度: | ||
合作方式: | 专利许可 | 交易价格(万): | 2.00 | 所属十强产业: |
本发明涉及一种医学文档专业词汇自动化标注方法,包括:对输入的医学文档进行数据预处理,得到预处理后的医学文档文本;获取词的字母级特征向量、单词级特征向量、语言特征向量并进行融合,作为词的编码向量;将分词后的医学文档文本的词标注分类得到标注数据集;对每一个词输出一个多维向量作为词的空间表示;获取增强后的标注数据集;进行训练建模,并最终输出标注结果。本发明设计合理,其采用半监督学习算法对大量未标注数据进行标注,成功地克服了现有医疗行业标注数据过少的缺陷,有效地提高了模型能够使用的数据量,并大幅提升算法对于关键词和专业词汇的标注准确率,可广泛用于医疗文献处理中。
联系方式
苏博晖
15614431192
请填写以下信息
联系人姓名:
联系人电话:
手机号:
邮箱:
QQ:
工作单位:
地址:
意向说明:
专注专业
资深行业经验,专业技术运作团队
信息保密
专利或技术全方位严格保密,保证用户权益
快速转让
依托大数据,精准对接需求企业,节约成本
一站式服务
技术转让一站式服务,省心更放心