python实现PPT素材模板网址爬取步骤(模板我都要)

   日期:2024-12-25    作者:099f5 移动:http://3jjewl.riyuangf.com/mobile/quote/18167.html

首先  我们要爬的网址是:PPT模板下载_PPT模板免费下载_幻灯片模板下载 -【优品PPT】

python实现PPT素材模板网址爬取步骤(模板我都要)

在浏览器地址栏输入这个网址访问进去,里面有很多PPT模板

我们随机点击一个进去,再点击下载  ,如图

我们拿一下下载页面的网址可爱卡通小猪佩奇PPT模板 - 优品PPT

然后点击下载,会跳转一个网址

紧接着,我们点击下载地址1或下载地址2,会直接下载

首先先导入我们的requests 模块  -----需安装 

 

紧接着写入代码

 

最基本的请求网址获取数据

然后就是我们的提取数据

采用正则表达式提取数据    -------导入正则模块   import re

data =re.findall('href="/article/.*?/(.*?).html"', res.text)

拿到我们的下载网址的id,并用for循环遍历(为什么用for循环),因为re提取出来的是一个列表数据。

用正则表达式提取

在把id拼接到我们的下载网址后面(注意是下载网址,不是首页的网址)

可爱卡通小猪佩奇PPT模板 - 优品PPT

 

然后请求我们的这个网址的到https://down.ypppt.com/uploads/soft/240909/1-240Z91R306.pptx

接下来就是保存数据

下面就是完整代码


 

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号