声明1:刷博客是你的权利,没有人会禁止你。但是,我们通过博客记录技术之路上的点滴,本人写博客的目的是纯粹作为网络日记留给自己用的。如果我们仅仅是为了访问量来写博客,那就侮辱了博客本身存在的意义。
声明2:www.omegaxyz.com增加了恶意机器人检查代码与反爬虫插件,实测无法刷本博客的访问量。
寒假闲着无聊自习研究了一下Python爬虫与代理。就发现了一个很简单的刷博客访问量的技巧。
首先,我们设置一个代理池,可以用数据库导入也可以简单的用一个数组。
代理池可以从http://www.xicidaili.com/选取(如上图)
由于两次访问不宜使用同一个IP因此每次随机从代理池中选择一个IP即可。更高级的可以在request时注入不同的Cookie来欺骗服务器。
其次利用python中urllib来获取网页。
在大多数网站能够刷很多的访问量。亲测CSDN有效。
代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
from urllib import request from random import randint url = "http://xxxxx" n = 1000 proxy = [{'https': '110.88.10.198'}, {'https': '182.88.117.118'}, {'https': '180.158.109.60'}, {'https': '110.88.10.198'}, {'https': '122.235.184.109'}, {'https': '221.3.39.207'}] for _ in range(n): proxy_support = request.ProxyHandler(proxy[randint(0, len(proxy)-1)]) opener = request.build_opener(proxy_support) opener.addheaders = [('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36')] request.install_opener(opener) response = request.urlopen(url) print((_ + 1) / n) |