节点文献

基于机器学习的专利文本分类算法研究综述

免费订阅

【作者】 刘红光马双刚刘桂锋

【Author】 Liu Hongguang;Ma Shuanggang;Liu Guifeng;Institute of Science and Technology Information, Jiangsu University;

【机构】 江苏大学科技信息研究所

【摘要】 总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的一般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程。将应用于专利文本分类的机器学习算法分为单一分类算法和组合分类算法着重探讨:单一分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法。指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望。

【所属期刊栏目】 情报分析 (2016年03期)
  • 【分类号】TP391.1;TP18;G306
  • 【被引频次】12
  • 【下载频次】1018
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: