python计算cpa的程序_Python爬取CAP之家的APP推广信息数据

   日期:2024-12-26    作者:hhh2020 移动:http://3jjewl.riyuangf.com/mobile/quote/34181.html

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

开发工具

python 3.6.5

pycharm

requests

time

csv

相关模块可pip安装

确定目标网页

获取数据内容

cap之家数据是动态数据加载的~ 开发者工具可以找到相对应的数据接口

请求数据是POST

数据内容找到了,单页数据可以直接爬取,如果想要爬取多页数据,那就要分析接口数据url的变化

因为数据接口是post请求,所以一般情况都是data参数的变化,所以查看data参数的变化就可以了~

第一页接口数据data参数

两个接口都是一样的数据,但是data参数不一样,第二个就是感觉data参数就是对应的页数号,所以可以多看几页的data参数的变化

第二页接口数据data参数

第三页接口数据data参数

这一下就很清楚的看到data参数的变化了~Pagelndex是等差数列 刚好对应的页数

所以再翻页爬取的时候只要改变Pagelndex参数就可以了

完整代码

代码还是很简单的

import requests

import time

import csv

f = open('APP推广数据.csv', mode='a', encoding='utf-8', newline='')

csv_writer = csv.DictWriter(f, fieldnames=['名称', '发布时间', '单价/元', '结算方式', '数据查看', '电话', '微信', 'QQ', '产品要求'])

csv_writer.writeheader()

for page in range(1, 81):

print('=========================================正在爬取第{}页的推广数据============================================================'.format(page))

url = 'https://www.cpajia.com/index.php?m=index&a=search'

data = {

'PageIndex': '{}'.format(page)

}

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

}

response = requests.post(url=url, data=data, headers=headers)

html_data = response.json()

lis = html_data[1:-1]

# pprint.pprint(lis)

dit = {}

for i in lis:

dit['名称'] = i['title']

data_time = int(i['updatetime'])

timeArray = time.localtime(data_time)

otherStyleTime = time.strftime("%Y--%m--%d %H:%M:%S", timeArray)

dit['发布时间'] = otherStyleTime

dit['单价/元'] = i['price']

dit['结算方式'] = i['balance']

dit['数据查看'] = i['dataview']

dit['电话'] = i['phone']

dit['微信'] = i['wxh']

dit['QQ'] = i['qq']

dit['产品要求'] = i['content']

csv_writer.writerow(dit)

print(dit)


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号