日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python多線程爬取西刺代理的示例代碼

瀏覽:202日期:2022-06-28 16:59:26

西刺代理是一個(gè)國(guó)內(nèi)IP代理,由于代理倒閉了,所以我就把原來(lái)的代碼放出來(lái)供大家學(xué)習(xí)吧。

鏡像地址:https://www.blib.cn/url/xcdl.html

首先找到所有的tr標(biāo)簽,與class='odd'的標(biāo)簽,然后提取出來(lái)。

python多線程爬取西刺代理的示例代碼

然后再依次找到tr標(biāo)簽里面的所有td標(biāo)簽,然后只提取出里面的[1,2,5,9]這四個(gè)標(biāo)簽的位置,其他的不提取。

python多線程爬取西刺代理的示例代碼

最后可以寫(xiě)出提取單一頁(yè)面的代碼,提取后將其保存到文件中。

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSouphead = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'}if __name__ == '__main__': ip_list=[] fp = open('SpiderAddr.json','a+',encoding='utf-8') url = 'https://www.blib.cn/url/xcdl.html' request = requests.get(url=url,headers=head) soup = BeautifulSoup(request.content,'lxml') data = soup.find_all(name='tr',attrs={'class': re.compile('|[^odd]')}) for item in data: soup_proxy = BeautifulSoup(str(item),'lxml') proxy_list = soup_proxy.find_all(name='td') for i in [1,2,5,9]: ip_list.append(proxy_list[i].string) print('[+] 爬行列表: {} 已轉(zhuǎn)存'.format(ip_list)) fp.write(str(ip_list) + ’n’) ip_list.clear()

爬取后會(huì)將文件保存為 SpiderAddr.json 格式。

python多線程爬取西刺代理的示例代碼

最后再使用另一段代碼,將其轉(zhuǎn)換為一個(gè)SSR代理工具直接能識(shí)別的格式,{’http’: ’http://119.101.112.31:9999’}

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSoupif __name__ == '__main__': result = [] fp = open('SpiderAddr.json','r') data = fp.readlines() for item in data: dic = {} read_line = eval(item.replace('n','')) Protocol = read_line[2].lower() if Protocol == 'http': dic[Protocol] = 'http://' + read_line[0] + ':' + read_line[1] else: dic[Protocol] = 'https://' + read_line[0] + ':' + read_line[1] result.append(dic) print(result)

python多線程爬取西刺代理的示例代碼

完整多線程版代碼如下所示。

import sys,re,threadingimport requests,lxmlfrom queue import Queueimport argparsefrom bs4 import BeautifulSouphead = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.100 Safari/537.36'}class AgentSpider(threading.Thread): def __init__(self,queue): threading.Thread.__init__(self) self._queue = queue def run(self): ip_list=[] fp = open('SpiderAddr.json','a+',encoding='utf-8') while not self._queue.empty(): url = self._queue.get() try:request = requests.get(url=url,headers=head)soup = BeautifulSoup(request.content,'lxml')data = soup.find_all(name='tr',attrs={'class': re.compile('|[^odd]')})for item in data: soup_proxy = BeautifulSoup(str(item),'lxml') proxy_list = soup_proxy.find_all(name='td') for i in [1,2,5,9]: ip_list.append(proxy_list[i].string) print('[+] 爬行列表: {} 已轉(zhuǎn)存'.format(ip_list)) fp.write(str(ip_list) + ’n’) ip_list.clear() except Exception:passdef StartThread(count): queue = Queue() threads = [] for item in range(1,int(count)+1): url = 'https://www.xicidaili.com/nn/{}'.format(item) queue.put(url) print('[+] 生成爬行鏈接 {}'.format(url)) for item in range(count): threads.append(AgentSpider(queue)) for t in threads: t.start() for t in threads: t.join()# 轉(zhuǎn)換函數(shù)def ConversionAgentIP(FileName): result = [] fp = open(FileName,'r') data = fp.readlines() for item in data: dic = {} read_line = eval(item.replace('n','')) Protocol = read_line[2].lower() if Protocol == 'http': dic[Protocol] = 'http://' + read_line[0] + ':' + read_line[1] else: dic[Protocol] = 'https://' + read_line[0] + ':' + read_line[1] result.append(dic) return resultif __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('-p','--page',dest='page',help='指定爬行多少頁(yè)') parser.add_argument('-f','--file',dest='file',help='將爬取到的結(jié)果轉(zhuǎn)化為代理格式 SpiderAddr.json') args = parser.parse_args() if args.page: StartThread(int(args.page)) elif args.file: dic = ConversionAgentIP(args.file) for item in dic: print(item) else: parser.print_help()

以上就是python多線程爬取西刺代理的示例代碼的詳細(xì)內(nèi)容,更多關(guān)于python多線程爬取代理的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
成人羞羞在线观看网站| 蜜臀av亚洲一区中文字幕| 激情综合亚洲| 国产精品传媒麻豆hd| 久久伊人国产| 久久精品资源| 欧美日韩国产一区二区三区不卡 | 日韩av首页| 99在线观看免费视频精品观看| 国产亚洲精品久久久久婷婷瑜伽| 黄色aa久久| 国产精品1luya在线播放| 国产日韩电影| 国产成人免费| 一区二区电影| 国产中文一区| 久久不卡国产精品一区二区| 欧美日韩精品一区二区视频| 精品国模一区二区三区| 亚洲午夜黄色| 欧美日韩一区二区国产| 国产精品高清一区二区| 亚洲乱码视频| 日韩欧美看国产| 欧美一级鲁丝片| 亚洲一二三区视频| 四虎4545www国产精品| 日韩中文字幕| 色婷婷狠狠五月综合天色拍| 国产精品黄色片| 国产不卡一区| 最新亚洲国产| 国产精品嫩草影院在线看| 日本中文字幕一区二区视频 | 图片区亚洲欧美小说区| 91久久中文| 亚洲激情偷拍| 视频在线观看一区| 老牛影视一区二区三区| 中文无码日韩欧| 视频一区日韩精品| 亚洲香蕉久久| 影音先锋国产精品| 91精品亚洲| 91中文字幕精品永久在线| 久久精品影视| 国产综合婷婷| 久久久成人网| 亚洲在线观看| 啪啪国产精品| 日韩中文av| 蜜桃免费网站一区二区三区| 欧美国产美女| 成人污污视频| 亚洲欧美日本国产 | 丰满少妇一区| 欧美另类中文字幕| 免费在线观看一区| 欧美日韩国产探花| 久久国产精品成人免费观看的软件| 欧美黑人巨大videos精品| 香蕉成人av| 国产真实久久| 久久精品国产99国产| 91精品精品| 亚洲午夜在线| 亚洲精品一区二区在线看| 日韩精品一区第一页| 国产精品一级| 国产精品极品| 国产不卡人人| 一区在线免费| 国产91欧美| 伊人久久大香线蕉av不卡| 国产一区日韩一区| 中文亚洲欧美| 国产日产一区| 精精国产xxxx视频在线野外| 秋霞影视一区二区三区| 亚洲一区二区三区高清| 久久激情综合网| 国产综合色区在线观看| 国产一区成人| 亚洲综合另类| 日韩avvvv在线播放| 成人国产综合| 亚洲永久精品唐人导航网址| 麻豆视频在线看| 四虎成人av| 国精品一区二区三区| 日韩中文字幕区一区有砖一区 | 免费高潮视频95在线观看网站| 国产精品.xx视频.xxtv| 精品一区视频| 一级欧美视频| 美女视频免费精品| 青青草伊人久久| 亚洲精品乱码久久久久久蜜桃麻豆 | 欧美69视频| 成人福利av| 国产精品分类| 日韩一区二区三区免费视频| 成人免费电影网址| 美女av一区| 日本h片久久| 美女精品久久| 粉嫩av一区二区三区四区五区| 亚洲我射av| 日韩精品久久久久久久软件91| 91亚洲精品在看在线观看高清| 亚洲一区久久| 亚洲精品看片| 国产精品1luya在线播放| 日韩成人亚洲| 久久免费国产| 麻豆91在线播放| 日本欧美久久久久免费播放网| 国产精品毛片久久久| 久久精品伊人| 国产精品成人自拍| 久久国产亚洲精品| 亚洲成人精选| 91国语精品自产拍| 性色一区二区| 日韩一区欧美二区| 亚洲三级网站| 少妇精品久久久一区二区三区| 日本亚洲视频在线| 免播放器亚洲一区| 激情视频网站在线播放色| 久久激情五月激情| 欧美日韩一区二区高清| 麻豆精品视频在线观看| av资源中文在线| 播放一区二区| 欧美有码在线| 日韩国产在线观看一区| 精品一区二区三区中文字幕视频| 麻豆一区在线| 日本亚洲欧美天堂免费| 日韩精品国产欧美| 欧美成人一二区| 婷婷综合福利| 国户精品久久久久久久久久久不卡| 日本不卡中文字幕| 亚洲三级观看| 国产精品手机在线播放| 久久影视一区| 日本特黄久久久高潮| 国产精品久久久免费| 美日韩精品视频| 伊人久久婷婷| 久久久久免费av| 久久亚洲精精品中文字幕| 99精品99| 免费视频一区二区| 伊人久久高清| 日韩av片子| 人人香蕉久久| 综合亚洲自拍| 久久精品国产网站| 黄色日韩在线| 久久免费国产| 亚洲欧美久久久| 国产农村妇女精品一区二区| 欧美成人精品| 午夜久久美女| 91欧美国产| 99久久夜色精品国产亚洲狼| 日本免费新一区视频| 四虎精品一区二区免费| 欧美久久精品| 亚洲欧美网站| 蜜桃视频在线观看一区二区| 欧美日韩激情| 激情91久久| 成人在线视频区| 免费久久99精品国产自在现线| 国产欧美一区二区三区精品酒店| 一区二区三区国产在线| 欧美日韩免费看片| 99精品电影| 999久久久国产精品| 手机精品视频在线观看| 中文字幕成在线观看| 日韩精品中文字幕第1页| 日韩激情啪啪| 怡红院精品视频在线观看极品| 精品国产亚洲一区二区三区在线| 免费精品视频最新在线| 亚洲一区二区日韩| 日韩一区二区三区免费视频| 99久久九九| 悠悠资源网久久精品| 亚洲爱爱视频| 日韩av中文字幕一区| 日韩在线一二三区| 国产剧情在线观看一区| 色综合www| 国产精品日本欧美一区二区三区|