节点文献

基于差异度量和互信息的文本特征选择算法

免费订阅

【作者】 潘晓英陈柳王昊赵逸喆孙俊

【Author】 PAN Xiaoying;CHEN Liu;WANG Hao;ZHAO Yizhe;SUN Jun;School of Computer Science and Technology,Xi’an University of Posts and Telecommunications;Shaanxi Key Laboratory of Network Data Analysis and Intelligent Processing,Xi’an University of Posts and Telecommunications;ULAB CO.,LTD,Xia’men;

【机构】 西安邮电大学计算机学院西安邮电大学陕西省网络数据分析与智能处理重点实验室厦门优莱柏网络科技有限公司

【摘要】 针对基于文档频率的特征选择算法易于忽略词频和类别关系的问题,提出一种基于差异度量和互信息的文本特征选择算法。融合归一化差异度量和互信息概念,引入词频信息和特征分布系数,弥补归一化差异度量算法在特征选择过程中忽略词频和特征词与类别之间关系的不足,并增加特征分布系数对其进一步优化。实验结果表明,在不同特征维度下,该算法能够有效提高文本分类准确率。

【基金】 国家自然科学基金资助项目(61702414)
【所属期刊栏目】 计算机与自动化 (2019年06期)
  • 【DOI】10.13682/j.issn.2095-6533.2019.06.010
  • 【分类号】TP391.1
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: