首页 > 个性签名 正文
【qq空间背景免费代码】python爬虫实战:QQ空间自动点赞工具

时间:2023-02-13 02:20:02 阅读: 评论: 作者:佚名

QQ空间自动点赞

前景总结目标决策分析介绍登录介绍cookie查找XML查找变量第一次空间动态查找赞所需的URL查找可变参数功能在秒赞全代码上升后,请给予小小的关注。通过自己真实爱情的死神小编01,可以获得大量的python学习资料。

展望概要

因为我身边的小伙伴每天对我说的最多的话之一是空间的第一次称赞。

所以还不如直接自动点赞,免得每天催我点赞。

确定目标

QQ空间超赞分析简介

获取登录cookie

首先,因为这是QQ空间的一系列工作,所以当然是先解决登陆方面的问题。这篇文章里我不太介绍。因为我前几期对QQ空间做了一定的介绍。请直接解开链接。欢迎来看博主以前的文章。

Def search_cookie():

Qq_number=input(输入' Qq编号3360 ')

Ifnot _ _ import _ _ ('OS ')。(' cookie _ dict . txt '):

Get_cookie_json(qq_number)

With open ('cookie _ dict.txt '' r') as f:

cookie=j(f)

Return True

defget _ cookie _ JSON(QQ _ number):

Password=_ _ import _ _ ('getpass ')。getpass(输入“密码3360”)

From selenium import网路驱动程式

From import Options

log in _ URL='

Chrome_options=Options()

C ('-headless ')

驱动程序=webdriver.chrome(选项=chrome _ options)

Driver.get(login_url)

driver . switch _ to _ frame(' log in _ frame ')

driver . find _ element _ by _ XPath('//*[@ id=' switcher _ plog in ']')。click(

(1)

driver . find _ element _ by _ XPath('//*[@ id=' u ']')。send _ keys (QQ _ ne)

driver . find _ element _ by _ XPath('//*[@ id=' p ']')。send _ keys (password)

(1)

driver . find _ element _ by _ XPath('//*[@ id=' log in _ button ']')。click()

(1)

cookie _ list=driver . get _ cookies()

cookie _ dict={ }

For cookie in cookie_list:

if ' name ' in cookie和' value ' in cookie 3360

cookie _ dict[cookie['名称']]=cookie['值']

With open ('cookie _ dict.txt '' w') as f:

j(cookie _ dict,f)

Return True

Def get_g_tk():

P_skey=['p_skey']

H=5381

For I in p_skey:

H=(h 5) ord(i)

G_tk=h 2147483647查找XML

获得cookie信息和名为g_tk的参数后,继续查找空间朋友的动态XML在哪里。

先搜索到XML位置,发现feeds3_html_more差不多,点击发现的确实是我们要找的URL链接。

查找可变参数

这个链接需要很多参数。这里列出来了。

举出来

  • uin:
  • scope:
  • view:
  • daylist:
  • uinlist:
  • gid:
  • flag:
  • filter:
  • applist:
  • refresh:
  • aisortEndTime:
  • aisortOffset:
  • getAisort:
  • aisortBeginTime:
  • pagenum:
  • externparam:
  • firstGetGroup:
  • icServerTime:
  • mixnocache:
  • scene:
  • begintime:
  • count:
  • dayspac:
  • sidomain:
  • useutf8:
  • outputhtmlfeed:
  • rd:
  • usertime:
  • windowId:
  • g_tk:
  • qzonetoken:
  • g_tk:

这些参数中类似于可变参数的一共有五个。

  • qzonetoken
  • windowId
  • rd
  • usertime
  • g_tk
  1. qzonetoken 参数在源码中是个可变的“定值”,因为每次刷新这个参数都会变,但是源码中却给出了他的具体值。直接获取即可。
def get_space(): your_url = '; + str(qq_number) html = reque(your_url,headers=headers,cookies=cookie) if == 200: qzonetoken = re.findall('window.g_qzonetoken =(.*?);',)[1].split('"')[1] return True
  1. windowId 与 rd 虽说每次刷新结果都不同,但是经过博主多次实验得出,这两个参数对整体并没有什么影响,可以直接抄下来。
'rd': '0.9311604844249088', 'windowId': '0.516',
  1. usertime 参数看似很眼熟,是个时间戳参数,因为位数不对,说明应该是被放大了一千倍。
'usertime': str(round() * 1000)),
  1. g_tk 参数上次教程已给出。在JavaScript中分析即可获得。
def get_g_tk(): p_skey = ['p_skey'] h = 5381 for i in p_skey: h += (h << 5) + ord(i) g_tk = h & 2147483647

获取第一个空间动态

我们拿到XML以及各个参数后,即可访问该网页获取其返回值了。
但是这个返回与其他的有一些不同的是,它不仅仅是个json文件,我们无法获取后直接转换成字典格式去给我们使用,这就很麻烦。


我们获取字符串后,首先先将前后不一致的都切片扔掉,之后经过一系列处理后发现,我们很难将这个看似像json格式的字符串转换成字典。
在这里我继续介绍一个第三方库demjson。

demjson 可以解決不正常的json格式数据

demjson的使用方法很简单。

encode将 Python 对象编码成 JSON 字符串decode将已编码的 JSON 字符串解码为 Python 对象

# 例子 # -*- coding: utf-8 -*- import demjson js_json = "{x:1, y:2, z:3}" py_json1 = "{'x':1, 'y':2, 'z':3}" py_json2 = '{"x":1, "y":2, "z":3}' data = demj(js_json) print(data) # {'y': 2, 'x': 1, 'z': 3} data = demj(py_json1) print(data) # {'y': 2, 'x': 1, 'z': 3} data = demj(py_json2) print(data) # {'y': 2, 'x': 1, 'z': 3}

我们使用demjson直接将该字符串转换为耳熟能详的字典格式,提取其中的data的data,即为前八条动态的每个参数,但我们这里只要第一个说说的动态信息。

text = [10:-2].replace(" ", "").replace('\n','') json_list = demj(text)['data']['data'] qq_spaces = json_list[0]

我们拿到其信息后,先提取一些我们比较想知道的东西,比如名字、QQ号、发布时间、所获赞数、说说内容、说说地址等等结果。
在 qq_spaces 参数中我们发现里面有一个很长也很特殊的一个结果是 html 结果,这个结果里面很长,简单来看是个网页常规代码,应该是被JavaScript写入到网页中了,既然不是全部代码,那么只能用正则提取一下里面的具体我们需要的东西了。

content = str(qq_spaces['html']) try:zanshu = re.findall('<spanclass="f-like-cnt">(.*?)</span>人觉得很赞</div>',content,re.S)[0] except:return None time_out = str(qq_spaces['feedstime']) print("名字:"+str(qq_spaces['nickname'])) print("QQ号:"+str(qq_spaces['opuin'])) print("时间:"+time_out) print('赞数:'+zanshu) times = qq_spaces['abstime'] his_url = re.findall('data-curkey="(.*?)"',content,re.S)[0]

寻找点赞所需的URL

在QQ空间随便找个好友点个赞吧,这样我们才能接收到请求。
我们首先清空原来动态产生的抓包,直接点个赞发现关于dolike的url只有三个,第一个是个POST请求,应该是我们所需要的点赞网址。

寻找可变参数

我们获取到URL后,找到里面所需要的参数。发现一共有十一个参数,在这里猜测应该不存在加密参数。

  1. qzreferrer参数为自己QQ空间的网址,表示从哪里来的链接地址。
  2. opuin参数为自己的QQ号,可以直接在代码提取。
  3. unikey参数与curkey参数为被点赞方的链接,即说说链接,刚才已获取。
  4. abstime参数为被点赞方说说的发布时间的时间戳。
  5. fid参数为被点赞方的链接后缀。

既然参数没什么问题那就直接写代码吧。

def get_zan(times,his_url): data = {'g_tk': g_tk,'qzonetoken': qzonetoken} post_data = { 'qzreferrer': ';+str(qq_number), 'opuin': str(qq_number), 'unikey': str(his_url), 'curkey': str(his_url), 'from': '1', 'appid': '311', 'typeid': '0', 'abstime': str(times), 'fid': str(his_url).split('/')[-1], 'active': '0', 'fupdate': '1' } url = '; url = url + urllib.(data) html = reque(url,headers=headers,cookies=cookie,data=post_data) if == 200:print("点赞成功" if len() == 469 else "点赞失败")

功能提升到秒赞

因为树莓派并不是很不错的问题,这个代码做不到绝对的秒赞。

  1. 在本地建立一个文件,负责写入最后一条说说所产生的时间戳。
  2. 比对当前时间戳与空间第一条说说是否相同,若相同则无更新。
  3. 点赞后重写文件,以便下次使用代码即可秒赞。
def run_tolike(): if os.(';): with open(';,'r') as f: time_out = f.read() else:time_out = None while True: get_friends_list() (__import__('random').randint(0,5)) # 秒赞?if not time_out or time_out != time_out: time_out = time_out get_zan(times,his_url) return True else:log('说说无更新,等待中...')with open(';,'w') as f: f.write(str(times))

全部代码

import time,os,json import re import demjson import urllib import requests from lxml import etree def log(content): this_time = ('%H:%M:%S',())) print("["+str(this_time)+"]" + content) class QQ_like: def __init__(self,qq_number): = {'User-Agent':'Mozilla (Windows NT 10.0; WOW64) AppleWebKi (KHTML, like Gecko) Chrome Safari;} = qq_number () () def get_preparameter(self): () () () def run_tolike(self): if os.(';): with open(';,'r') as f: = f.read() else: = None while True: () (__import__('random').randint(0,5)) def search_cookie(self): if not os.('cookie_dict.txt'): () with open('cookie_dict.txt', 'r') as f: =j(f) return True def get_cookie_json(self): password = __import__('getpass').getpass('请输入密码:') from selenium import webdriver from import Options login_url = '; chrome_options =Options() c('--headless') driver = webdriver.Chrome(options=chrome_options) driver.get(login_url) driver.switch_to_frame('login_frame') driver.find_element_by_xpath('//*[@id="switcher_plogin"]').click() (1) driver.find_element_by_xpath('//*[@id="u"]').send_keys() driver.find_element_by_xpath('//*[@id="p"]').send_keys(password) (1) driver.find_element_by_xpath('//*[@id="login_button"]').click() (1) cookie_list = driver.get_cookies() cookie_dict = {} for cookie in cookie_list: if 'name' in cookie and 'value' in cookie: cookie_dict[cookie['name']] = cookie['value'] with open('cookie_dict.txt', 'w') as f: j(cookie_dict, f) return True def get_g_tk(self): p_skey = ['p_skey'] h = 5381 for i in p_skey: h += (h << 5) + ord(i) = h & 2147483647 def get_space(self): your_url = '; + str() html = reque(your_url,headers=,cookies=) if == 200: = re.findall('window.g_qzonetoken =(.*?);',)[1].split('"')[1] return True def get_friends_list(self): times = "" url = "; data = { 'uin': , 'scope': '0', 'view': '1', 'daylist': '', 'uinlist': '', 'gid': '', 'flag': '1', 'filter':'all', 'applist': 'all', 'refresh': '0', 'aisortEndTime': '0', 'aisortOffset': '0', 'getAisort': '0', 'aisortBeginTime': '0', 'pagenum': '1', 'externparam': 'undefined', 'firstGetGroup': '0', 'icServerTime': '0', 'mixnocache': '0', 'scene': '0', 'begintime': 'undefined', 'count': '10', 'dayspac': 'undefined', 'sidomain': 'qzone;, 'useutf8': '1', 'outputhtmlfeed': '1', 'rd': '0.9311604844249088', 'usertime': str(round() * 1000)), 'windowId': '0.516', 'g_tk': , 'qzonetoken': , } url = url + urllib.(data) + '&g_tk=' + str() html = reque(url,headers=,cookies=) if == 200: text = [10:-2].replace(" ", "").replace('\n','') json_list = demj(text)['data']['data'] qq_spaces = json_list[0] content = str(qq_spaces['html']) try:zanshu = re.findall('<spanclass="f-like-cnt">(.*?)</span>人觉得很赞</div>',content,re.S)[0] except:return None time_out = str(qq_spaces['feedstime']) log("名字:"+str(qq_spaces['nickname'])) log("QQ号:"+str(qq_spaces['opuin'])) log("时间:"+time_out) log('赞数:'+zanshu) times = qq_spaces['abstime'] his_url = re.findall('data-curkey="(.*?)"',content,re.S)[0] if not or != time_out: = time_out (times,his_url) return True else:log('说说无更新,等待中...') else:log() def get_zan(self,times,his_url): data = {'g_tk': ,'qzonetoken': } post_data = { 'qzreferrer': ';+str(qq_number), 'opuin': str(qq_number), 'unikey': str(his_url), 'curkey': str(his_url), 'from': '1', 'appid': '311', 'typeid': '0', 'abstime': str(times), 'fid': str(his_url).split('/')[-1], 'active': '0', 'fupdate': '1' } url = '; url = url + urllib.(data) html = reque(url,headers=,cookies=,data=post_data) if == 200:log("点赞成功" if len() == 469 else "点赞失败") with open(';,'w') as f: f.write(str(times)) if __name__ == "__main__": qq_number = input('请输入qq号:') QQ_like(qq_number)
  • 评论列表

发表评论: