节点文献

维、哈、柯多文种搜索引擎中web文本分类的研究

免费订阅

【作者】 海丽且木·艾沙维尼拉·木沙江

【Author】 Halqam Aisa,Winira Musajan(Colleges of Information Science and Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China)

【机构】 新疆大学信息科学与工程学院

【摘要】 研究维、哈、柯多文种搜索引擎中web文本分类问题.根据维、哈、柯Web文本具有结构信息的特点,提出分类系统框架,采用基于改进的KNN的Web文本分类方法,并结合具体实验在对数据进行预处理的基础上实现了改进的KNN分类算法.实验表明,改进的KNN方法在维吾尔文Web文本分类中能够获得较好的分类效果.

【关键词】 Web文本分类KNN算法特征提取维吾尔文
【基金】 国家自然科学基金项目(61063022);新疆维吾尔自治区高校科研计划重点资助项目(XJEDU2006113)
【所属期刊栏目】 信息科学与技术 (2011年03期)
  • 【分类号】TP391.1
  • 【被引频次】3
  • 【下载频次】54
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: