节点文献

一种基于形式概念分析的Web文档标签聚类方法

免费订阅

【作者】 李辉王竞张福稳

【Author】 LI Hui1,WANG Jing2,ZHANG Fu-wen3(1.Xihua University Archives,Chengdu 610039 China;2.School of Mathematics and Computer,Xihua University,Chengdu 610039 China;3.77538 Army,Lasa 850000 China)

【机构】 西华大学档案馆西华大学数学与计算机学院77538部队

【摘要】 针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。

【基金】 国家自然科学基金项目(61271413);教育部“春晖计划”项目(12226531);四川省人事厅学术与技术带头人培养计划(12226463)
【所属期刊栏目】 计算机软件理论、技术与应用 (2013年03期)
  • 【分类号】TP391.1
  • 【下载频次】81
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: