客服热线:19932581850

基于大数据的中文网页个性化精准分类系统

次浏览
  • 详细信息
  • 成果简介
  • 成果亮点
  • 前景分析
成果名称: 基于大数据的中文网页个性化精准分类系统 关键字: 网页 , 分类 , url , 中文 , 文本 , 信息 , 海量 , 抓取 , 数据 , 字段 应用行业: 计算机、通信和其他电子设备制造业
高新技术领域: 电子信息技术 所在地: 知识产权类型: 发明专利
知识产权编号: CN202410710621.2 成果体现形式: 成果属性:
成果所处阶段: 实质审查 成果水平: 国内先进 研究形式:
学科分类: 战略新兴产业: 新一代信息技术 课题来源:
第一完成单位名称: 第一完成单位属性: 技术成熟度:
合作方式: 专利许可 交易价格(万): 7.00 所属十强产业:

本申请的基于大数据的中文网页个性化精准分类系统,设计了对HTML无用标签的过滤算法,得到较高价值的网页文本内容。在最大顺序匹配分词算法上,采用三字长交集型歧义字段处理,提高了分词过程中的歧义识别能力。改进了基于TF*IDF的权重计算方法,结合CHI计算量计算权重,综合考虑了特征项在某类文本和所有文本中出现次数、类别信息对权重的影响和特征出现位置对权重的影响。实现了中文自动分类模型,设计了中文网页自动分类各个模块的构建方法,有效组织和处理网络上的海量信息,让人们更好的搜索到自己想要的资源,本申请网页自动分类是实现快速信息检索的重要技术,分类准确率达到96.3%,满足个性化网页分类需求。

  • 附件

联系方式

  • 联系人:

    姜女士(技术经理人)

  • 联系电话:

    17310148509

  • QQ/MSN:

  • Email:

  • 通讯地址:

请填写以下信息

  • 联系人姓名:

  • 联系人电话:

  • 手机号:

  • 邮箱:

  • QQ:

  • 工作单位:

  • 地址:

  • 意向说明:

  • 取消 确定

    友情链接

  • logo图片

    专注专业

    资深行业经验,专业技术运作团队

  • logo图片

    信息保密

    专利或技术全方位严格保密,保证用户权益

  • logo图片

    快速转让

    依托大数据,精准对接需求企业,节约成本

  • logo图片

    一站式服务

    技术转让一站式服务,省心更放心