节点文献

维文垃圾网页多元线性回归识别研究

免费订阅

【作者】 李永可吴悠张太红冯向萍吴向前

【Author】 LI Yong-ke~1,WU You~2,ZHANG Tai-hong~1,FENG Xiang-ping~1,WU Xiang-qian~3 (1.College of Computer and Information Engineering,Xinjiang Agricultural University,Urumuqi Xinjiang 830052,China,2.College of Information Science and Engineering,University of Electronic Science and Technology,Chengdu Sichan 611731,China;3.College of Information Science and Engineering,Xinjiang University,Urumqi Xinjiang 830046,China)

【机构】 新疆农业大学计算机与信息工程学院电子科技大学计算机科学与工程学院新疆大学信息科学与工程学院

【摘要】 本文在对维文垃圾网页特征分析基础上,利用卡方检验方法提取网页特征,并采用最小二乘估计方法,设计了维吾尔文垃圾网页识别模型.为检测不同特征对模型性能的影响,本文分别对网页维文字符个数及关键词进行对比实验.结果表明,在特征包含网页维文字符长度,特征词个数在5~20个之间时,模型识别精确度达90%左右,网页维文字符个数在维吾尔文垃圾网页模型构建中具有重要作用.

【基金】 自治区高技术研究发展项目(201012112);自治区电子发展专项资金项目(XJDZZXZJ20109)
【所属期刊栏目】 信息科学与技术 (2012年02期)
  • 【分类号】TP393.092
  • 【被引频次】3
  • 【下载频次】85
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: