节点文献

一种基于属性加权补集的朴素贝叶斯文本分类算法

免费订阅

【作者】 陈凯黄英来高文韬赵鹏

【Author】 CHEN Kai;HUANG Ying-lai;GAO Wen-tao;ZHAO Peng;Information and Computer Engineering College,Northeast Forestry University;Harbin Metro Group Co.,Ltd.;

【通讯作者】 黄英来;

【机构】 东北林业大学信息与计算机工程学院哈尔滨地铁集团有限公司

【摘要】 针对文本训练集中各个类别的样本分布不均衡时,少数类别的特征会被多数类别的特征淹没的问题,提出一种属性加权补集的朴素贝叶斯文本分类算法,该算法使用属性加权改进补集朴素贝叶斯算法,使用TF-IDF算法计算特征词在当前文档中的权重;利用当前类别补集的特征表示当前类别的特征并结合特征词在文档中的权重,解决分类器容易倾向大类别而忽略小类别的问题。与传统的朴素贝叶斯及补集朴素贝叶斯算法进行对比实验,结果表明:在样本集分布不均衡时,改进算法的性能表现最优,分类准确率、召回率及G-mean性能分别可达82.92%、84.6%、88.76%。

【基金】 新世纪优秀人才基金(NCET-12-0809);国家自然科学基金(31670717)
  • 【DOI】10.15938/j.jhust.2018.04.013
  • 【分类号】TP391.1
  • 【下载频次】60
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: