节点文献

垂直搜索中网页抓取技术的研究

免费订阅

【作者】 陈哲

【机构】 山东经贸职业学院

【摘要】 网页抓取是由一个称为网络爬虫的程序实现的,该程序是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上提取新的URL放入队列,直到满足系统的一定停止条件。

【关键词】 网络爬虫网页搜集网页抓取
【所属期刊栏目】 计算机与网络 (2009年22期)
  • 【分类号】TP391.3
  • 【被引频次】17
  • 【下载频次】290
节点文献中: 

本文链接的文献网络图示:

浏览历史:
下载历史: