博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用简易Python爬虫下载百度贴吧图片
阅读量:5993 次
发布时间:2019-06-20

本文共 543 字,大约阅读时间需要 1 分钟。

hot3.png

    百度贴吧有贴吧的帖子中有很漂亮的图片,如有很多适合做系统桌面壁纸的图片,而是用一次一次的下载很是麻烦,所以是用Python写了一个简易的脚本,写的不好,希望大家不要见笑,新手。

Python代码如下:

#!/usr/bin/pythonimport reimport urllibdef getHtml(url):    page=urllib.urlopen(url)    html=page.read()    return htmldef getImg(html):    reg=r'src="(.*?\.jpg)"'    imgre=re.compile(reg)    imglist=re.findall(imgre,html)    x=0    for imgurl in imglist:        urllib.urlretrieve(imgurl,'%s.jpg'%x)        x+=1y=raw_input('Please input your URL:>')html=getHtml(y)getImg(html)

有问题可以咨询我的SINA微博:

转载于:https://my.oschina.net/meilmneu/blog/150842

你可能感兴趣的文章
百万级访问网站前期的技术准备
查看>>
python安装
查看>>
CentOS7.3.1611部署k8s1.5.2集群
查看>>
依赖注入
查看>>
router ospf命令
查看>>
Centos7手动安装OpenStack Mitaka版本--基本环境安装
查看>>
VLAN原理详解
查看>>
linux系统中的三个时间
查看>>
PHP开发0-PHP语言简介
查看>>
从学习c++到Java----编程启示录
查看>>
使用EasyRecovery恢复RAW格式的U盘数据
查看>>
资源收藏
查看>>
晨读打卡(2018.2)
查看>>
shell 信号列表
查看>>
深入浅出之正则表达式(一)
查看>>
数据库知识笔记
查看>>
企业级备份方案系列PART1:SCDPM 2012安装和配置
查看>>
小蚂蚁学习Redis笔记(1)——Redis简介、适用场景、对比
查看>>
我的友情链接
查看>>
ESXI支持linux远程命令管理
查看>>