日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python爬蟲簡單運用爬取代理IP的實現

瀏覽:28日期:2022-07-03 15:00:48

功能1: 爬取西拉ip代理官網上的代理ip

環境:python3.8+pycharm庫:requests,lxml瀏覽器:谷歌IP地址:http://www.xiladaili.com/gaoni/

分析網頁源碼:

Python爬蟲簡單運用爬取代理IP的實現

選中div元素后右鍵找到Copy再深入子菜單找到Copy Xpath點擊一下就復制到XPath

Python爬蟲簡單運用爬取代理IP的實現

我們復制下來的Xpth內容為:/html/body/div/div[3]/div[2]/table/tbody/tr[50]/td[1]雖然可以查出來ip,但不利于程序自動爬取所有IP,利用谷歌XpathHelp測試一下

Python爬蟲簡單運用爬取代理IP的實現

從上圖可以看出,只匹配到了一個Ip,我們稍作修改,即可達到目的,有關xpath規則,可以參考下表;

Python爬蟲簡單運用爬取代理IP的實現

Python爬蟲簡單運用爬取代理IP的實現

Python爬蟲簡單運用爬取代理IP的實現

經過上面的規則學習后,我們修改為://*[@class=‘mt-0 mb-2 table-responsive’]/table/tbody/tr/td[1],再利用xpthhelp工具驗證一下:

Python爬蟲簡單運用爬取代理IP的實現

這樣我們就可以爬取整個頁面的Ip地址了,為了方便爬取更多的IP,我們繼續往下翻頁,找到翻頁按鈕:

Python爬蟲簡單運用爬取代理IP的實現

找規律,發現每翻一頁,a標簽下的href連接地址加1即可,python程序可以利用for循環解決翻頁問題即可。為了提高IP代理的質量,我們爬取評分高的IP來使用。找到評分欄下的Xpath路徑,這里不再做詳細介紹,思路參考上面找IP地址的思路,及XPath規則,過程參考下圖:

Python爬蟲簡單運用爬取代理IP的實現

Python代碼實現

代碼可復制粘貼直接使用,如果出現報錯,修改一下cookie。這里使用代理ip爬取,防止IP被封。當然這里的代碼還是基礎的,有空可以寫成代理池,多任務去爬。當然還可以使用其它思路去實現,這里只做入門介紹。當有了這些代理IP后,我們可以用文件保存,或者保存到數據庫中,根據實際使用情況而定,這里不做保存,只放到列表變量中保存。

import requestsfrom lxml import etreeimport timeclass XiLaIp_Spider: def __init__(self): self.url = ’http://www.xiladaili.com/gaoni/’ self.headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36’, ’cookie’: ’td_cookie=1539882751; csrftoken=lymOXQp49maLMeKXS1byEMMmsavQPtOCOUwy6WIbfMNazZW80xKKA8RW2Zuo6ssy; Hm_lvt_31dfac66a938040b9bf68ee2294f9fa9=1592547159; Hm_lvt_9bfa8deaeafc6083c5e4683d7892f23d=1592535959,1592539254,1592612217; Hm_lpvt_9bfa8deaeafc6083c5e4683d7892f23d=1592612332’, } self.proxy = ’116.196.85.150:3128’ self.proxies = { 'http': 'http://%(proxy)s/' % {’proxy’: self.proxy}, 'https': 'http://%(proxy)s/' % {’proxy’: self.proxy} } self.list1 = [] def get_url(self): file = open(’Ip_Proxy.txt’, ’a’, encoding=’utf-8’) ok_file = open(’OkIp_Proxy.txt’, ’a’, encoding=’utf-8’) for index in range(50): time.sleep(3) try:res = requests.get(url=self.url if index == 0 else self.url + str(index) + '/', headers=self.headers, proxies=self.proxies, timeout=10).text except:continue data = etree.HTML(res).xpath('//*[@class=’mt-0 mb-2 table-responsive’]/table/tbody/tr/td[1]') # ’//*[@id='scroll']/table/tbody/tr/td[1]’ score_data = etree.HTML(res).xpath('//*[@class=’mt-0 mb-2 table-responsive’]/table/tbody/tr/td[8]') for i, j in zip(data, score_data):# file.write(i.text + ’n’)score = int(j.text)# 追加評分率大于十萬的ipif score > 100000: self.list1.append(i.text) set(self.list1) file.close() ok_ip = [] for i in self.list1: try:# 驗證代理ip是否有效res = requests.get(url=’https://www.baidu.com’, headers=self.headers, proxies={’http’: ’http://’ + i}, timeout=10)if res.status_code == 200: # ok_file.write(i + ’n’) ok_ip.append(i) except:continue ok_file.close() return ok_ip def run(self): return self.get_url()dl = XiLaIp_Spider()dl.run()

到此這篇關于Python爬蟲簡單運用爬取代理IP的實現的文章就介紹到這了,更多相關Python 爬取代理IP內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产探花一区| 99视频精品视频高清免费| 久久伦理在线| 久久久久久久久丰满| 99久久九九| 成人av动漫在线观看| 日韩精品一区二区三区免费观影| 欧美久久天堂| 国产美女高潮在线观看| 国产精品国产一区| 国产盗摄——sm在线视频| 国产 日韩 欧美一区| 91精品亚洲| 亚洲在线国产日韩欧美| 亚洲深深色噜噜狠狠爱网站 | 国产精品调教| 久久99精品久久久野外观看| 国产中文欧美日韩在线| 日韩免费小视频| 在线一区视频| 91精品丝袜国产高跟在线| 久久一区亚洲| 免费福利视频一区二区三区| 国产一区二区三区自拍| 在线亚洲观看| 97久久超碰| 美女av在线免费看| 免费国产自久久久久三四区久久| 久久国产精品免费一区二区三区| 精品久久影院| 88久久精品| 水蜜桃久久夜色精品一区| 婷婷亚洲五月色综合| 一区二区亚洲视频| 国产精品国产三级在线观看| 91视频一区| 99成人在线| 国产日韩1区| 日韩高清不卡| 在线一区二区三区视频| 国产精品1区在线| 日韩免费小视频| 自拍自偷一区二区三区| 欧美激情视频一区二区三区免费 | 久久久精品五月天| 男女男精品网站| 91国内精品| 日韩欧美一区二区三区免费观看| 男女激情视频一区| 久久久久久色 | 蜜臀久久99精品久久一区二区| 国产一区2区| 国产免费播放一区二区| 91青青国产在线观看精品| 亚洲一区国产| 美女视频免费精品| 亚洲一区二区三区免费在线观看 | 国产日韩欧美一区在线| 欧美日韩一区二区综合| 欧美日本精品| 亚洲国产影院| 国产精品久久免费视频| 久久人人精品| 国产精品一卡| 麻豆91精品| 欧洲一区二区三区精品| 日韩精品国产欧美| 色婷婷精品视频| 国产亚洲一卡2卡3卡4卡新区| 在线日韩一区| 精品国产乱码久久久久久樱花| 亚洲一区免费| 日韩一区电影| 国产精品激情电影| 热久久免费视频| 99久久久久国产精品| 国产精品videosex极品| 99热精品在线观看| 日韩精品dvd| 欧美韩一区二区| 亚洲v天堂v手机在线| 精品一区毛片| 亚洲男女av一区二区| 亚洲精品在线国产| 国产三级一区| 久久99伊人| 久久激情婷婷| 精品资源在线| 日本精品在线播放| 亚洲欧美久久| 久久天堂成人| 久久青青视频| 日韩欧美激情电影| 日韩中文字幕av电影| 激情欧美日韩一区| 国产精品99视频| 嫩草伊人久久精品少妇av杨幂 | 欧美日本一区| 亚洲精品亚洲人成在线观看| 91超碰国产精品| 美女网站视频一区| 日本不卡免费高清视频在线| 国产精品毛片视频| 欧美视频精品全部免费观看| 老鸭窝毛片一区二区三区| 亚洲先锋成人| 亚洲性视频h| 亚洲午夜黄色| 国精品一区二区三区| 精品国模一区二区三区| 日韩网站中文字幕| 91精品国产自产在线观看永久∴| 成人午夜精品| 欧美xxxx中国| 一区二区电影| 欧美日本一区| 欧美精品福利| 91午夜精品| 香蕉久久久久久| 99pao成人国产永久免费视频| 欧美在线影院| 亚洲免费黄色| 亚洲欧美日韩国产综合精品二区 | 国产精品porn| 久久精品一本| 91视频一区| 91精品国产乱码久久久久久久| 99精品在线观看| 91精品91| 免费久久99精品国产| 亚洲精品婷婷| 日韩久久99| 欧美亚洲免费| 麻豆91小视频| 日韩精品永久网址| 久久在线免费| 性一交一乱一区二区洋洋av| 亚洲久久一区| 国产亚洲一卡2卡3卡4卡新区| 美女久久久精品| 欧洲亚洲一区二区三区| 红桃视频国产一区| 中文字幕日韩亚洲| 国产一精品一av一免费爽爽| 欧美91在线| 成人在线视频区| 伊人精品一区| 亚洲日本免费电影| 日精品一区二区三区| 清纯唯美亚洲综合一区| 精品欧美视频| 欧美影院三区| 日韩精品一二三区| 热久久久久久| 91亚洲自偷观看高清| 婷婷综合在线| 日韩精品导航| 国产一区2区在线观看| 免费精品国产的网站免费观看| 中文字幕免费精品| 麻豆国产精品| 欧美精品资源| 中文字幕日本一区二区| 免费在线成人| 欧美日韩国产在线观看网站| 日本一区二区三区视频在线看| 久久精品理论片| 午夜久久久久| 久久激情五月婷婷| 91精品综合| 日本一区二区中文字幕| 精品美女视频| 老司机精品久久| 久久精品国产99国产精品| 欧美中文字幕一区二区| 日韩高清欧美激情| 国产999精品在线观看| 夜夜精品视频| 麻豆一区二区99久久久久| 欧美一级精品| 国产亚洲欧美日韩精品一区二区三区| 三级在线看中文字幕完整版| 欧美羞羞视频| 日韩精品欧美成人高清一区二区| 亚洲欧美日韩一区在线观看| 97se亚洲| 色婷婷精品视频| 日韩中文一区二区| 日韩久久视频| 日韩精品亚洲一区二区三区免费| 韩国久久久久久| 一区二区三区国产盗摄| 你懂的国产精品永久在线| 亚洲成人日韩| 久久精品国产99国产精品| 日韩中文欧美在线| 麻豆视频在线看| 欧美伊人影院| 黄色在线一区| 在线人成日本视频|