联系人姓名:
联系人电话:
手机号:
邮箱:
QQ:
工作单位:
地址:
意向说明:
免费查询
一种基于MPI的ML-KNN多标签中文文本分类方法
成果名称: | 一种基于MPI的ML-KNN多标签中文文本分类方法 | 关键字: | mpi , 文本 , 样本 , 进程 , knn , 标签 , 分类 , 词汇 , 词汇表 , 训练集 | 应用行业: | 计算机、通信和其他电子设备制造业 |
高新技术领域: | 电子信息技术 | 所在地: | 重庆市 | 知识产权类型: | 发明专利 |
知识产权编号: | CN201710026254.4 | 成果体现形式: | 成果属性: | ||
成果所处阶段: | 成果水平: | 国内先进 | 研究形式: | ||
学科分类: | 战略新兴产业: | 新一代信息技术 | 课题来源: | ||
第一完成单位名称: | 重庆邮电大学 | 第一完成单位属性: | 技术成熟度: | ||
合作方式: | 请选择... | 交易价格(万): | 3.00 | 所属十强产业: |
本发明请求保护一种基于MPI的ML‑KNN多标签中文文本分类方法,涉及文本分类和机器学习中的多标签分类算法。为解决ML‑KNN算法在具体实现中大规模文本分类问题和求解优化问题,控制计算的时间和空间的开销,本发明采用的技术方案是,采用MPI编程实现中文文本数据的预处理、特征提取、ML‑KNN算法及分类的并行化。相比传统的串行多标签中文文本分类方法,本发明极大的提高了多标签中文文本分类的效率。同时,在数据量一定的情况下,算法的效率一般会随着计算资源(进程数)的增加而增加。值得一提的是,在基于MPI并行化ML‑KNN步骤中,对数据集进行划分时既可以以样本为单位划分,又可以以特征为单位划分,这使得本发明在处理高维文本数据的时候,具有更大的优势。
联系方式
姜女士
17310148509
请填写以下信息
联系人姓名:
联系人电话:
手机号:
邮箱:
QQ:
工作单位:
地址:
意向说明:
专注专业
资深行业经验,专业技术运作团队
信息保密
专利或技术全方位严格保密,保证用户权益
快速转让
依托大数据,精准对接需求企业,节约成本
一站式服务
技术转让一站式服务,省心更放心