单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,17,章,Python,网络爬虫,第17章 Python网络爬虫,什么是爬虫?,什么是爬虫?,优点,快速开发,1,跨平台,2,解释性,3,多种网络爬虫框架,4,优点快速开发1跨平台2解释性3多种网络爬虫框架4,网络爬虫的常用技术,网络爬虫的常用技术,网络请求,1,请求,headers,处理,2,网络超时,3,代理服务,4,解析,HTML,5,网络请求1请求headers处理2网络超时3代理服务4解析H,Urllib,模块,1,Urllib3,模块,2,Requests,模块,3,Urllib1Urllib32Requests3,请求,headers,处理,请求headers处理,网络超时,网络超时,网络断开,1,网络不稳定,2,网络堵塞,3,网速过慢,4,网络断开1网络不稳定2网络堵塞3网速过慢4,代理服务,代理服务,解析,HTML,解析HTML,网络爬虫开发常用框架,Scrapy,网络爬虫开发常用框架Scrapy,搭建,Scrapy,爬虫框架,搭建Scrapy爬虫框架,实现步骤,安装,Twisted,模块,安装,Scrapy,安装,pywin32,实现步骤安装Twisted模块安装Scrapy安装pywin,创建,Scrapy,项目,创建Scrapy项目,创建爬虫,创建爬虫,实战,:,快手爬票,实战:快手爬票,分析请求参数,4,创建,项目,2,主窗体设计,3,概述,1,下载站名文件,5,获取车票信息,6,分析请求参数4创建2主窗体设计3概述1下载站名文件5获取车票,谢谢观看,谢谢观看,