Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

getproxies.py 这个文件是不是增加代理的? #24

Open
vipwpcom opened this issue Nov 15, 2016 · 10 comments
Open

getproxies.py 这个文件是不是增加代理的? #24

vipwpcom opened this issue Nov 15, 2016 · 10 comments

Comments

@vipwpcom
Copy link

def get_proxies(self):
# 快代理
#url = 'http://dev.kuaidaili.com/api/getproxy/?orderid=955742122799513&num=100&area=%E5%A4%A7%E9%99%86&b_pcchrome=1&b_pcie=1&b_pcff=1&protocol=1&method=2&an_ha=1&sp1=1&sep=1'
# 代理666
#url = 'http://qsdrk.daili666api.com/ip/?tid=559017461234554&num=100&delay=3&category=2&sortby=time&foreign=none&filter=on'
url = 'http://qsdrk.daili666api.com/ip/?tid=555451817416492&num=100&delay=3&category=2&sortby=time&foreign=none&filter=on'
r = requests.get(url)
lines = r.text.split()
for line in lines:
logger.debug(line)
try:
host, port = line.split(':')
Proxy.objects.get_or_create(host=host, port=int(port))
except Exception as e:
print e

  1. 当我增加到100多个公众号时,再去添加公众号,就没有任何反应了
@yijingping
Copy link
Member

yijingping commented Nov 15, 2016

1 是的,这个文件是从“快代理”网的api获取代理用的。 后来发现代理质量太差,就没有再用了。
2 django后台可以添加搜索代理和下载代理。如果没有设置,默认都是不使用代理。 如果连续添加100个,有可能是你的ip被封了,搜不出来东西,所以没有反应。
解决方法有2个:
1) 等1天左右,ip自动解封
2)为搜索专门设置代理,如下图所示,注意“状态选检测成功”
image

@vipwpcom
Copy link
Author

@yijingping 感谢!

@vipwpcom
Copy link
Author

@yijingping 关于下载等待的问题。我在v2ex找到之前您之前的回复,
qq 20161117155035
我是否可以这样理解

  1. 买一个动态vps (这个是vps它自己自动拨号了?还是要人工作业 ---如截图中的:定时自动重新拨号软件(如拨号精灵) )
    2.在动态vps上部署 bin/getNewIp.py
 期待您的回复!

@yijingping
Copy link
Member

@vipwpcom 对的。在vps上安装拨号精灵,然后部署 bin/getNewIp.py 就可以了。 加我微信,我给你1台你用用看。

@vipwpcom
Copy link
Author

@yijingping 我在这里发现一个项目感觉挺好,自动采集网络上的代理ip 高匿ip可用性还是比较高的
https://github.com/qiyeboy/IPProxys (IPProxys代理池项目,提供代理ip)
是否可以将它作为插件,或者模块的方式加入本项目中呢?
望回复!

@yijingping
Copy link
Member

@vipwpcom 不打算这么做。 现在的网络代理基本上已经被人爬了N多次了,即使付费,都没有什么好的代理ip。 建议的方案是:如果发现被封,就重新拨号。 这是更靠谱的方式。

@axliumf
Copy link

axliumf commented Nov 21, 2016

@yijingping 你的微信多少,能否加一下,几个问题请教你一下,谢谢

@yijingping
Copy link
Member

jingpingyi

@banqinghong
Copy link

如果使用vps是不是爬虫项目都要放到那台vps上面?如果我爬虫部署在本地,这种应该怎么部署?直接将vps的ip地址和端口手动添加吗?

@yijingping
Copy link
Member

@banqinghong vps如果只做代理的话,需要在vps打开代理服务,并在vps上 执行bin/getNewIp.py 获取最新的ip,并提交给爬虫。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants