客服热线:19932581850

一种基于MPI的ML-KNN多标签中文文本分类方法

次浏览
  • 详细信息
  • 成果简介
  • 成果亮点
  • 前景分析
成果名称: 一种基于MPI的ML-KNN多标签中文文本分类方法 关键字: mpi , 文本 , 样本 , 进程 , knn , 标签 , 分类 , 词汇 , 词汇表 , 训练集 应用行业: 计算机、通信和其他电子设备制造业
高新技术领域: 电子信息技术 所在地: 重庆市 知识产权类型: 发明专利
知识产权编号: CN201710026254.4 成果体现形式: 成果属性:
成果所处阶段: 成果水平: 国内先进 研究形式:
学科分类: 战略新兴产业: 新一代信息技术 课题来源:
第一完成单位名称: 重庆邮电大学 第一完成单位属性: 技术成熟度:
合作方式: 请选择... 交易价格(万): 3.00 所属十强产业:

本发明请求保护一种基于MPI的ML‑KNN多标签中文文本分类方法,涉及文本分类和机器学习中的多标签分类算法。为解决ML‑KNN算法在具体实现中大规模文本分类问题和求解优化问题,控制计算的时间和空间的开销,本发明采用的技术方案是,采用MPI编程实现中文文本数据的预处理、特征提取、ML‑KNN算法及分类的并行化。相比传统的串行多标签中文文本分类方法,本发明极大的提高了多标签中文文本分类的效率。同时,在数据量一定的情况下,算法的效率一般会随着计算资源(进程数)的增加而增加。值得一提的是,在基于MPI并行化ML‑KNN步骤中,对数据集进行划分时既可以以样本为单位划分,又可以以特征为单位划分,这使得本发明在处理高维文本数据的时候,具有更大的优势。

  • 附件

联系方式

  • 联系人:

    姜女士

  • 联系电话:

    17310148509

  • QQ/MSN:

  • Email:

  • 通讯地址:

请填写以下信息

  • 联系人姓名:

  • 联系人电话:

  • 手机号:

  • 邮箱:

  • QQ:

  • 工作单位:

  • 地址:

  • 意向说明:

  • 取消 确定

    友情链接

  • logo图片

    专注专业

    资深行业经验,专业技术运作团队

  • logo图片

    信息保密

    专利或技术全方位严格保密,保证用户权益

  • logo图片

    快速转让

    依托大数据,精准对接需求企业,节约成本

  • logo图片

    一站式服务

    技术转让一站式服务,省心更放心