Google隐藏次级域名抓取

最近忙着找实习,时间又忙,前几天本想找个内网啥的,结果接的任务的内网不是短时间搞得下来的。 但是昨儿有朋友跟我谈起二级域名抓取的问题,因为大家都知道,市面上有几款api查询次级域名,但是很多时候都查不完,邮局,快过期的域名,注册未名的,内网入口。尤其是不大不小的站,这种是在api中查不了的。关于因此昨儿写了个py,直接上东西。 如果有朋友对版权问题有异议,请私信博主更改和添加。 优缺点: 1.代码是借鉴了一部分别人的,其中包括(haxxxxx兄),毕竟小弟不是码农,代码看起来有点山寨。。 2.没有采用多线程,因为google api在没有连国外VPN时多线程2+就得崩,这种本来运行也不慢,所以综合考虑没有采用它。 3.最后整理为去重复的字典result.txt,可以直接导入御剑啥的。 4.中间产生了些临时文件,启动删除时可以清理。 5.没有采用win下必备的模块,跨平台性。。(话说haxxxxx兄写的东西真的挺好,不过基本每次都要加上win模块,让小弟好生伤心、) 6.最后,用法并非单一,功能大神们改进后继续发掘。 朋友的原创不错,比我这个好,代码也更简洁。不过我估计他博客有我就不发了。 友链里自己找出那位大神喔。 PS:本来想直接发他的。。。脸皮还是不够厚啊。

附件: 需要的第三方模块以及代码==> 我传的百度盘: http://pan.baidu.com/share/link?shareid=1068142402&uk=4113276289 http://pan.baidu.com/share/link?shareid=1070462314&uk=4113276289