客服热线:19932581850

基于互约束主题模型的半结构短文本集中子话题发现方法

次浏览
  • 详细信息
  • 成果简介
  • 成果亮点
  • 前景分析
成果名称: 基于互约束主题模型的半结构短文本集中子话题发现方法 关键字: 话题 , 标签 , 短文 , 主题 , 词汇 , 语义 , 聚类 , 文本 , 潜在 , 模型 应用行业: 制造业
高新技术领域: 先进制造技术 所在地: 天津市 知识产权类型: 发明专利
知识产权编号: CN201710484399.9 成果体现形式: 成果属性:
成果所处阶段: 授权 成果水平: 国内一般 研究形式:
学科分类: 战略新兴产业: 高端装备制造 课题来源:
第一完成单位名称: 天津科技大学 第一完成单位属性: 技术成熟度:
合作方式: 专利许可 交易价格(万): 2.00 所属十强产业:

本发明涉及一种基于互约束主题模型的半结构短文本集中子话题发现方法,其主要技术特点是:对含话题标签的短文本集合进行数据清洗;按照种子话题标签抽取出针对某一话题的含指定种子话题标签的短文本;对清洗后的数据进行输入文件生成;将输入文件输入至互约束主题模型中进行模型训练;得到集合中话题标签的语义向量表示、所在文本的平均语义向量表示以及话题标签所在文本的词汇向量表示;将三个向量表示依次接连起来作为一个话题标签的完整语义表示;使用Kmeans聚类方法进行聚类,将聚类得到的类别的质心作为子话题输出。本发明设计合理,其采用互约束潜在主题建模,解决了现有半结构短文本主题语义建模技术面临的高稀疏和高噪音的问题。

  • 附件

联系方式

  • 联系人:

    苏博晖

  • 联系电话:

    15614431192

  • QQ/MSN:

  • Email:

  • 通讯地址:

请填写以下信息

  • 联系人姓名:

  • 联系人电话:

  • 手机号:

  • 邮箱:

  • QQ:

  • 工作单位:

  • 地址:

  • 意向说明:

  • 取消 确定

    友情链接

  • logo图片

    专注专业

    资深行业经验,专业技术运作团队

  • logo图片

    信息保密

    专利或技术全方位严格保密,保证用户权益

  • logo图片

    快速转让

    依托大数据,精准对接需求企业,节约成本

  • logo图片

    一站式服务

    技术转让一站式服务,省心更放心