Python应用现在如火如荼,应用范围很广。因其效率高开发迅速的优势,快速进入编程语言排行榜前几名。本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结。希望大家能够快速入门并学习Python这门语言。
1.项目概述。
利用XPath和requests模块进行网页抓取与分析,达到网页图片下载的效果。
抓爬图片地址:http://www.2cto.com/meinv/
开发环境:python 2.7、PyCharm 5 Community
所需知识:神器XPath、Requests模块、Python基本语法。
2.所需模块介绍及安装
Xpath
介绍:XPath其实是一门可以在XML中通过元素的属性进行查找提取信息的一门语言。它支持HTML。
与正则表达式相比,更简单。更强大
安装:下载lxml库进行安装操作。下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml。下载对应版本的lxml
打开库目录运行命令进行安装
下载完成之后,请把后缀名whl改为zip。
解压文件把lxml文件夹放入python安装目录的lib文件夹下。
Requests模块安装
具体详细安装步骤请参阅:Python实战:Python爬虫学习教程,获取电影排行榜 中requests的安装。
3.Xpath提取查找内容详解:
是语言都不例外,Xpath也有一定语法。
// 定位根节点
/ 往下层寻找
/text() 提取文本内容
/@xxx 提取属性内容
4.项目主体代码
from lxml import etree
selector = etree.HTML(网页源代码)
selector.xpath(xpath语法)
import requests
requests.get(url)
5.代码演示:
效果展示:
但尚需修改哦。
QQ技术交流群: 538742639
下篇:Python学习入门教程,字符串函数扩充详解
用户评论
这个名字起的真吸引人!
有8位网友表示赞同!
想看看能下载哪些类型的美女图片啊?
有11位网友表示赞同!
我不会python,这样sprogramm能用得舒服吗?
有9位网友表示赞同!
海量图片真的能下载吗? 速度要快才好!
有19位网友表示赞同!
这么棒的游戏我还真没玩过呢!
有9位网友表示赞同!
听说这个下载器还可以自定义搜索?真是功能强大!
有19位网友表示赞同!
有没有人试过,照片质量怎么样啊?
有11位网友表示赞同!
学习Python正好可以用这个程序,太合适了!
有11位网友表示赞同!
这游戏感觉很实用啊,我可以试试。
有11位网友表示赞同!
下载速度快吗?我怕下载很慢就放弃了~
有20位网友表示赞同!
这么火的游戏肯定得去体验一下啊!
有17位网友表示赞同!
这款软件界面是不是也很人性化呢?
有17位网友表示赞同!
这个游戏名字起的很有创意,让人很想一探究竟。
有11位网友表示赞同!
听起来蛮有趣的,不过要注意版权问题吧!
有13位网友表示赞同!
有没有教程可以学习一下下啊? 我想试试看!
有20位网友表示赞同!
美女图片下载器确实很有吸引力啊!期待它的到来。
有12位网友表示赞同!
游戏玩法简单,但是实用性很强啊!
有20位网友表示赞同!
这款软件能用吗?真机效测试怎么样?
有9位网友表示赞同!
这么个厉害的功能,一定很受歡迎吧!
有11位网友表示赞同!
希望这个游戏能够更新到更多类型的图片!
有19位网友表示赞同!