日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python爬蟲實例——爬取美團美食數據

瀏覽:260日期:2022-07-17 13:01:01

1.分析美團美食網頁的url參數構成

1)搜索要點

美團美食,地址:北京,搜索關鍵詞:火鍋

2)爬取的url

https://bj.meituan.com/s/%E7%81%AB%E9%94%85/

3)說明

url會有自動編碼中文功能。所以火鍋二字指的就是這一串我們不認識的代碼%E7%81%AB%E9%94%85。

通過關鍵詞城市的url構造,解析當前url中的bj=北京,/s/后面跟搜索關鍵詞。

這樣我們就可以了解到當前url的構造。

2.分析頁面數據來源(F12開發者工具)

開啟F12開發者工具,并且刷新當前頁面:可以看到切換到第二頁時候,我們的url沒有變化,網站也沒有自動進行刷新跳轉操作。(web中ajax技術就是在保證頁面不刷新,url不變化情況下進行數據加載的技術)

Python爬蟲實例——爬取美團美食數據

此時我們需要在開發者工具中,找到xhr里面對應當前數據的響應文件。

Python爬蟲實例——爬取美團美食數據

分析到這里可以得知:我們的數據是以json格式交互。分析第二頁的json文件請求地址與第三頁json文件的請求地址。

第二頁:https://apimobile.meituan.com/group/v4/poi/pcsearch/1?uuid=xxx&userid=-1&limit=32&offset=32&cateId=-1&q=%E7%81%AB%E9%94%85

第三頁:https://apimobile.meituan.com/group/v4/poi/pcsearch/1?uuid=xxx&userid=-1&limit=32&offset=64&cateId=-1&q=%E7%81%AB%E9%94%85

對比發現:offse參數每次翻頁增加32,并且limit參數是一次請求的數據量,offse是數據請求的開始元素,q是搜索關鍵詞poi/pcsearch/1?其中的1是北京城市的id編號。

3.構造請求抓取美團美食數據

接下來直接構造請求,循環訪問每一頁的數據,最終代碼如下。

import requestsimport redef start(): for w in range(0, 1600, 32): #頁碼根據實際情況x32即可,我這里是設置50頁為上限,為了避免設置頁碼過高或者數據過少情況,定義最大上限為1600-也就是50頁,使用try-except來檢測時候異常,異常跳過該頁,一般作為無數據跳過該頁處理 try: # 注意uuid后面參數空余將uuid后xxx替換為自己的uuid參數 url = ’https://apimobile.meituan.com/group/v4/poi/pcsearch/1?uuid=xxx&userid=-1&limit=32&offset=’+str(w)+’&cateId=-1&q=%E7%81%AB%E9%94%85’ #headers的數據可以在F12開發者工具下面的requests_headers中查看,需要實現選擇如下headers信息 #必要情況 請求頻繁 建議增加cookie參數在headers內 headers = {’Accept’: ’*/*’,’Accept-Encoding’: ’gzip, deflate, br’,’Accept-Language’: ’zh-CN,zh;q=0.9’,’Connection’: ’keep-alive’,’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3741.400 QQBrowser/10.5.3863.400’,’Host’: ’apimobile.meituan.com’,’Origin’: ’https://bj.meituan.com’,’Referer’: ’https://bj.meituan.com/s/%E7%81%AB%E9%94%85/’ } response = requests.get(url, headers=headers) #正則獲取當前響應內容中的數據,因json方法無法針對店鋪特有的title鍵值進行獲取沒所以采用正則 titles = re.findall(’','title':'(.*?)','address':'’, response.text) addresses = re.findall(’,'address':'(.*?)',’, response.text) avgprices = re.findall(’,'avgprice':(.*?),’, response.text) avgscores = re.findall(’,'avgscore':(.*?),’,response.text) comments = re.findall(’,'comments':(.*?),’,response.text) #輸出當前返回數據的長度 是否為32 print(len(titles), len(addresses), len(avgprices), len(avgscores), len(comments)) for o in range(len(titles)): #循環遍歷每一個值 寫入文件中 title = titles[o] address = addresses[o] avgprice = avgprices[o] avgscore = avgscores[o] comment = comments[o] #寫入本地文件 file_data(title, address, avgprice, avgscore, comment)#文件寫入方法def file_data(title, address, avgprice, avgscore, comment): data = {’店鋪名稱’: title,’店鋪地址’: address,’平均消費價格’: avgprice,’店鋪評分’: avgscore,’評價人數’: comment } with open(’美團美食.txt’, ’a’, encoding=’utf-8’)as fb: fb.write(json.dumps(data, ensure_ascii=False) + ’n’) #ensure_ascii=False必須加因為json.dumps方法不關閉轉碼會導致出現亂碼情況if __name__ == ’__main__’: start()

運行結果如下:

Python爬蟲實例——爬取美團美食數據

本地文件:

Python爬蟲實例——爬取美團美食數據

4.總結

根據搜索詞變化,城市變化,可以改變url中指定的參數來實現。同時也要記得變更headers中的指定參數,方法簡單,多加練習即可熟悉ajax類型的數據抓取。

以上就是Python爬蟲實例——爬取美團美食數據的詳細內容,更多關于Python爬蟲爬取美食數據的資料請關注好吧啦網其它相關文章!

標簽: 美團 Python
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
亚洲精品1区2区| 久久国产乱子精品免费女| 精品国产乱码| 狠狠久久伊人中文字幕| 国产乱码精品一区二区三区亚洲人| 日韩精品91亚洲二区在线观看| 免费成人av在线播放| 亚洲精品美女91| 日韩高清在线不卡| 国产精品玖玖玖在线资源| 精品国内亚洲2022精品成人 | 久久国产中文字幕| 自拍日韩欧美| 久色成人在线| 91午夜精品| 精品不卡一区| 久久久久久久久丰满| 好吊日精品视频| 在线免费观看亚洲| 国产日韩一区二区三免费高清| 精品国产日韩欧美精品国产欧美日韩一区二区三区 | 欧美日韩一二三四| 香蕉久久久久久久av网站| 美国三级日本三级久久99| 欧美专区一区| 国产一区二区三区免费在线| 激情久久久久久久| 亚洲精品福利| 精品一区二区三区在线观看视频| 都市激情国产精品| 亚洲电影在线一区二区三区| 亚洲天堂日韩在线| 麻豆久久久久久| 精精国产xxxx视频在线播放| 在线综合视频| 久久精品 人人爱| 97精品国产一区二区三区| 日韩精品免费一区二区三区| 国产亚洲精品自拍| 国产伦精品一区二区三区在线播放 | 国产精品欧美在线观看| 日韩av自拍| 99re国产精品| 久久精品99国产精品| yellow在线观看网址| 美女久久网站| 久久久免费人体| 免费不卡中文字幕在线| 日本va欧美va瓶| 免费观看亚洲| 日韩在线卡一卡二| 风间由美中文字幕在线看视频国产欧美| 亚洲91视频| 91综合久久爱com| 999久久久91| 国产精品综合| 99国产精品视频免费观看一公开 | 精品国产亚洲日本| 黄色av日韩| 蜜桃精品视频| 99在线观看免费视频精品观看| 国产精品v一区二区三区| 亚洲韩日在线| 国产精品最新| 亚洲激情精品| 久久精品国产99| 视频一区视频二区中文字幕| 国产精品115| 石原莉奈在线亚洲二区| 精品国产日韩欧美精品国产欧美日韩一区二区三区 | 婷婷综合激情| 国产精品mv在线观看| 丝袜美腿高跟呻吟高潮一区| 日韩av自拍| 久久狠狠久久| 视频在线观看一区| 亚洲第一精品影视| 国产极品嫩模在线观看91精品| 久久国产电影| 91视频一区| 国产探花一区| 日本欧美在线看| 欧美日韩高清| 日韩一区三区| 国产在线一区不卡| 国产欧美日韩影院| 亚洲精品乱码| 国产模特精品视频久久久久| 日本欧美不卡| 成人一二三区| 欧美激情麻豆| 日韩动漫一区| 久久www成人_看片免费不卡| 日韩精品影视| 97精品视频在线看| 精品国产一区二区三区av片| 国产日韩欧美高清免费| 亚洲a级精品| 天使萌一区二区三区免费观看| 韩国精品主播一区二区在线观看| 精品一区二区三区中文字幕视频 | 精精国产xxxx视频在线播放| 开心激情综合| 国产精品sm| 国产伦理久久久久久妇女| 免费成人在线观看| 国产精品日韩| 日韩一区二区免费看| 美女毛片一区二区三区四区| 久久久久国产一区二区| 日韩国产激情| 日韩欧美精品一区| 中文字幕在线看片| bbw在线视频| 天堂√中文最新版在线| 亚洲永久av| 日本精品不卡| 久久久久国产| 精品一区在线| 黑丝美女一区二区| 色爱综合av| 欧美亚洲国产激情| 精品在线播放| 亚洲欧美日韩一区在线观看| 午夜一级久久| 一区二区国产精品| 日韩国产欧美三级| 国产精品蜜月aⅴ在线| 免费日韩成人| 色婷婷综合网| 91精品精品| 午夜视频精品| 免费看精品久久片| 亚洲欧美网站在线观看| 日韩毛片一区| 青草综合视频| 久久精品一区二区三区中文字幕| 成人在线观看免费视频| 人人香蕉久久| 亚洲欧美日韩一区在线观看| 亚洲日产国产精品| 国产精品流白浆在线观看| 粉嫩av一区二区三区四区五区 | 久久久777| 国产视频一区三区| 一区二区三区国产在线| 日韩高清中文字幕一区| 欧美激情五月| 日韩精品欧美| 免费久久99精品国产自在现线| 亚洲精品欧洲| 国产精品对白| 色天使综合视频| 亚洲一区网站| 国产亚洲第一伦理第一区| 国产成人免费av一区二区午夜| 99久久精品费精品国产| 三级一区在线视频先锋| 国产精品久久| 在线日韩av| 日韩精品一区二区三区免费视频| 国产精品一区毛片| 一本大道色婷婷在线| 一区二区自拍| 国产亚洲欧美日韩在线观看一区二区| 国产一区二区三区四区| 91久久视频| 欧美日本久久| 亚洲涩涩在线| 亚洲理论在线| 国产一区二区三区四区二区| 久久一区二区三区喷水| 日韩一区二区三区四区五区| 精品九九久久| 免费视频久久| 嫩草伊人久久精品少妇av杨幂| 日韩欧美不卡| 亚洲精品系列| 国产精品麻豆久久| 男女性色大片免费观看一区二区 | 日韩欧美另类一区二区| 亚洲精品在线二区| 吉吉日韩欧美| 日韩高清中文字幕一区| а√在线中文在线新版| 午夜日韩影院| 天堂中文av在线资源库| 日韩精品欧美精品| 久久久精品网| 国产日产一区| 亚洲精品午夜av福利久久蜜桃| 国产精品一级| 免费日韩一区二区| 98精品视频| 日本视频中文字幕一区二区三区| 另类中文字幕国产精品| 久久狠狠亚洲综合| 国产精品腿扒开做爽爽爽挤奶网站| 精品入口麻豆88视频| 亚洲欧美久久|