2018Python网络爬虫数据采集 Selenium 2框架工具应用 requests网络编程

作者: admin 分类: Python教程合集 发布时间: 2018-07-05 01:29

01
准备工具
【回放】知识结构/路线图/环境工具准备(3月6日 20:30-21:15)
02
网站与网页
【回放】网站/网页前端技术概述(3月8日 20:30-21:30)
【录播】站点结构处理(5分钟)
【录播】HTML定义网页结构(26分钟)
【录播】CSS 定义网页表现(13分钟)
【录播】JavaScript 定义网页行为(20分钟)
03
HTTP超文本传输协议基础
【回放】HTTP基础(3月13日 20:30-21:15)
04
HTTP 资源
【录播】URL解析(13分钟)
【录播】URL编码与解码(9分钟)
【录播】资源类型及类型协商(7分钟)
05
HTTP 消息
【录播】请求与响应(5分钟)
【录播】HTTP请求方法(6分钟)
【录播】headers 头部信息(6分钟)
【录播】响应及状态(7分钟)
06
Python 标准库 urllib应用 I
【回放】Python 标准库 urllib应用(3月20日 20:30-21:30)
【录播】urllib 处理web请求与响应(10分钟)
【录播】response 状态码与错误处理(12分钟)
07
Python 标准库 urllib应用 II
【录播】自定义header请求/内容协商/User-Agent(5分钟)
【录播】HTTP 请求方法(7分钟)
【录播】URL/QueryString与地址栏编码(4分钟)
08
Web Cookies
【录播】Cookies 机制与原理(12分钟)
【录播】Python 处理cookies(8分钟)
09
requests HTTP编程
【回放】requests 库应用(3月27日 20:30-21:15)
【录播】requests 概述(5分钟)
【录播】请求构造与参数传递(8分钟)
【录播】response 响应解析: 文本/二进制/JSON(7分钟)
【录播】requests cookies 处理(10分钟)
10
数据爬取与采集
【回放】数据爬取与采集(4月3日 20:30-21:30)
【录播】图片资源下载(7分钟)
【录播】文本数据采集(7分钟)
11
JSON与API
【录播】JSON概述(7分钟)
【录播】Python JSON操作(7分钟)
【录播】API 爬取与解析(7分钟)
12
BeautifulSoup4 HTML解析与提取
【回放】BeautifulSoup4 HTML解析(4月10日 20:30-21:30)
【录播】bs4概述及安装配置(7分钟)
【录播】BeautifulSoup4核心对象(7分钟)
【录播】DOM 导航(7分钟)
【录播】Web 元素查找与过滤(7分钟)
13
爬虫性能与并发处理
【回放】多线程爬虫并发处理(4月24日 20:30-21:30)
【录播】Python 并行编程概述(7分钟)
【录播】Python 多线程编程(7分钟)
【录播】高IO并发爬虫实现(7分钟)
14
数据存储之:文本/CSV/Excel
【回放】数据存储之:文本/CSV/Excel(5月2日 20:30-21:30)
【录播】采集数据文本存储(7分钟)
【录播】采集数据CSV存储(7分钟)
【录播】采集数据Excel存储(7分钟)
15
数据存储之:SQL关系型数据库
【回放】采集数据Python SQLite存储(5月8日 20:30-21:30)
【录播】SQLite 库表管理(7分钟)
【录播】SQL CRUD操作(7分钟)
【录播】Python sqlite3模块应用(7分钟)
【录播】采集数据 SQL存储(7分钟)
16
数据存储之:MongoDB
【回放】PyMongo 存储数据到MongoDB(5月15日 20:30-21:30)
【录播】MongoDB 概述(7分钟)
【录播】MongoDB 集合/文档/字段管理(7分钟)
【录播】PyMongo 数据管理(7分钟)
【录播】采集数据 MongoDB存储(7分钟)
17
表单与登录
【回放】表单数据提交(5月22日 20:30-21:15)
【录播】表单文本/选项值提交(7分钟)
【录播】文件与图片上传提交(7分钟)
【录播】Web 状态管理概述(7分钟)
【录播】表单登录及cookies/session管理(7分钟)
18
爬虫验证码处理机制
【回放】爬虫验证码常用处理机制(5月31日 20:30-21:30)
【录播】验证码 cookies处理(7分钟)
【录播】图片文本识别技术(7分钟)
【录播】打码服务与Python API(7分钟)
19
反爬虫技术应对
【录播】常见反爬虫技术应对(7分钟)
【录播】时间频率控制与 Headers头部信息模拟(7分钟)
【录播】IP代理切换(7分钟)
20
Selenium 2框架应用 I
【回放】Selenium 2 模拟人工操作(6月5日 20:30-21:00)
【录播】概述与Selenium 2/驱动安装(7分钟)
【录播】WebDriver 浏览器交互(7分钟)
21
Selenium 2框架应用 II
【录播】Web 元素定位与查找(7分钟)
【录播】WebElement 网页元素:文本/值/属性/状态(7分钟)
【录播】元素交互之:鼠标键盘事件(7分钟)
【录播】实现网页自动截图(7分钟)
22
爬虫陷阱之动态内容处理
【回放】JS脚本执行与AJAX异步处理(6月19日 20:30-21:00)
【录播】Selenium2 后台脚本执行(7分钟)
【录播】处理AJAX异步加载元素(7分钟)
【录播】网页转跳处理(7分钟)
23
爬虫测试
【回放】爬虫单元测试用例编写(6月26日 20:30-21:00)
【录播】Python unittest 单元测试(7分钟)
【录播】爬虫与单元测试(7分钟)
【录播】Selenium 与单元测试(7分钟)

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多阅读