• 1.摘要
  • 2.基本信息
  • 3.内容简介
  • 4.目录

Python网络数据采集

《Python网络数据采集》是2016年人民邮电出版社出版的图书,作者是【美】米切尔 ( RyanMitchell )。

基本信息

  • 书名

    Python网络数据采集

  • 作者

    【美】米切尔(RyanMitchell)

  • ISBN

    978-7-115-41629-2

  • 页数

    200页

  • 定价

    59元

内容简介

本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第1部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。

目录

译者序 ix

前言 xi

第一部分 创建爬虫

第1章 初见网络爬虫 2

1.1 网络连接 2

1.2 BeautifulSoup简介 4

1.2.1 安装BeautifulSoup 5

1.2.2 运行BeautifulSoup 7

1.2.3 可靠的网络连接 8

第2章 复杂HTML解析 11

2.1 不是一直都要用锤子 11

2.2 再端一碗BeautifulSoup 12

2.2.1 BeautifulSoup的find()和findAll() 13

2.2.2 其他BeautifulSoup对象 15

2.2.3 导航树 16

2.3 正则表达式 19