文献知网节
  • 记笔记

Python语言中re库的使用技巧与目标网络数据的抓取

沈承放1莫达隆2

1. 广西师范大学数学与统计学院2. 贺州学院数学与计算机学院

摘要:在大数据的时代背景下,为了能够准确有效的获取网络数据,定向抓取相关网页数据的网络爬虫应运而生。python是网络爬虫首选的程序设计语言,它拥有着丰富且强大的库,能够简洁有、效的实现目标网络数据的获取,其中re库是一个用来提取目标数据的优秀的python库。为了深入学习re库的使用方法,首先了解正则表达式的概念和语法,从而更好地理解python语言的re库,深入探究re库的使用技巧,包括使用原理、功能函数等。介绍目标网络爬虫原理、网络数据抓取的一般流程,以及re库在获取目标网络数据中的应用。最后以某某劳动力市场为例实现目标网络数据的获取。
  • 专辑:

    教育与社会科学综合; 电子技术及信息科学

  • 专题:

    计算机软件及计算机应用

  • 分类号:

    TP312.1;TP391.3

  • 手机阅读
    即刻使用手机阅读
    第一步

    扫描二维码下载

    "移动知网-全球学术快报"客户端

    第二步

    打开“全球学术快报”

    点击首页左上角的扫描图标

    第三步

    扫描二维码

    手机同步阅读本篇文献

  • HTML阅读
  • CAJ下载
  • PDF下载

下载手机APP用APP扫此码同步阅读该篇文章

下载:214 页码:151-156 页数:6 大小:3637K

相关文献推荐
  • 相似文献
  • 读者推荐
  • 相关基金文献
  • 关联作者