日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

瀏覽:42日期:2022-06-16 18:40:50
一、項(xiàng)目需求

爬取排行榜小說的作者,書名,分類以及完結(jié)或連載

二、項(xiàng)目分析

目標(biāo)url:“https://www.qidian.com/rank/hotsales?style=1&page=1”

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

通過控制臺(tái)搜索發(fā)現(xiàn)相應(yīng)信息均存在于html靜態(tài)網(wǎng)頁中,所以此次爬蟲難度較低。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

通過控制臺(tái)觀察發(fā)現(xiàn),需要的內(nèi)容都在一個(gè)個(gè)li列表中,每一個(gè)列表代表一本書的內(nèi)容。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

在li中找到所需的內(nèi)容

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

找到第兩頁的url“https://www.qidian.com/rank/hotsales?style=1&page=1”“https://www.qidian.com/rank/hotsales?style=1&page=2”對(duì)比找到頁數(shù)變化開始編寫scrapy程序。

三、程序編寫

創(chuàng)建項(xiàng)目太簡(jiǎn)單,不說了

1.編寫item(數(shù)據(jù)存儲(chǔ))

import scrapyclass QidianHotItem(scrapy.Item): name = scrapy.Field() #名稱 author = scrapy.Field() #作者 type = scrapy.Field() #類型 form= scrapy.Field() #是否完載

2.編寫spider(數(shù)據(jù)抓取(核心代碼))

#coding:utf-8from scrapy import Requestfrom scrapy.spiders import Spiderfrom ..items import QidianHotItem#導(dǎo)入下需要的庫class HotSalesSpider(Spider):#設(shè)置spider的類 name = 'hot' #爬蟲的名稱 qidian_header={'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'} #設(shè)置header current_page = 1 #爬蟲起始頁 def start_requests(self): #重寫第一次請(qǐng)求url='https://www.qidian.com/rank/hotsales?style=1&page=1'yield Request(url,headers=self.qidian_header,callback=self.hot_parse)#Request發(fā)起鏈接請(qǐng)求#url:目標(biāo)url#header:設(shè)置頭部(模擬瀏覽器)#callback:設(shè)置頁面抓起方式(空默認(rèn)為parse) def hot_parse(self, response):#數(shù)據(jù)解析#xpath定位list_selector=response.xpath('//div[@class=’book-mid-info’]')#獲取所有小說for one_selector in list_selector: #獲取小說信息 name=one_selector.xpath('h4/a/text()').extract()[0] #獲取作者 author=one_selector.xpath('p[1]/a[1]/text()').extract()[0] #獲取類型 type=one_selector.xpath('p[1]/a[2]/text()').extract()[0] # 獲取形式 form=one_selector.xpath('p[1]/span/text()').extract()[0] item = QidianHotItem() #生產(chǎn)存儲(chǔ)器,進(jìn)行信息存儲(chǔ) item[’name’] = name item[’author’] = author item[’type’] = type item[’form’] = form yield item #送出信息 # 獲取下一頁URL,并生成一個(gè)request請(qǐng)求 self.current_page += 1 if self.current_page <= 10:#爬取前10頁next_url = 'https://www.qidian.com/rank/hotsales?style=1&page='+str(self.current_page)yield Request(url=next_url,headers=self.qidian_header,callback=self.hot_parse) def css_parse(self,response):#css定位list_selector = response.css('[class=’book-mid-info’]')for one_selector in list_selector: # 獲取小說信息 name = one_selector.css('h4>a::text').extract()[0] # 獲取作者 author = one_selector.css('.author a::text').extract()[0] # 獲取類型 type = one_selector.css('.author a::text').extract()[1] # 獲取形式 form = one_selector.css('.author span::text').extract()[0] # 定義字典 item=QidianHotItem() item[’name’]=name item[’author’] = author item[’type’] = type item[’form’] = form yield item

3.start.py(代替命令行)

在爬蟲項(xiàng)目文件夾下創(chuàng)建start.py。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

from scrapy import cmdline#導(dǎo)入cmd命令窗口cmdline.execute('scrapy crawl hot -o hot.csv' .split())#運(yùn)行爬蟲并生產(chǎn)csv文件

出現(xiàn)類似的過程代表爬取成功。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

hot.csv

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

總結(jié)

本次爬蟲內(nèi)容還是十分簡(jiǎn)單的因?yàn)橹挥昧藄pider和item,這幾乎是所有scrapy都必須調(diào)用的文件,后期還會(huì)有middlewarse.py,pipelines.py,setting.py需要編寫和配置,以及從javascript和json中提取數(shù)據(jù),難度較大。

到此這篇關(guān)于Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單的文章就介紹到這了,更多相關(guān)Python爬取起點(diǎn)中文網(wǎng)內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久中文亚洲字幕| 97精品国产福利一区二区三区| 国产一区二区三区四区五区传媒 | 欧美1区免费| 国产韩日影视精品| 美女国产一区| 午夜天堂精品久久久久| 日本三级亚洲精品| 美女性感视频久久| 97精品中文字幕| 在线成人直播| 日韩区一区二| 高清一区二区| 亚洲黄页一区| 男女激情视频一区| 欧美一级二区| 国产在线观看www| 欧美 日韩 国产一区二区在线视频| 国产精品免费看| 69堂精品视频在线播放| 色一区二区三区| 中文字幕一区日韩精品| 久久99影视| 夜夜嗨一区二区| 国产精品亚洲一区二区在线观看| 免费一二一二在线视频| 综合国产视频| 日韩欧美二区| 日本综合视频| 日韩在线精品| 91欧美精品| 欧美亚洲激情| 麻豆国产欧美日韩综合精品二区| 亚洲福利专区| 麻豆一区二区三区| 蜜桃久久久久久| 激情婷婷久久| 日韩综合在线| 久久激情五月婷婷| 国产美女精品| 成人羞羞视频播放网站| 国产精品亚洲综合在线观看| 亚洲一区欧美二区| se01亚洲视频 | 黄色在线观看www| 国产精品主播| 天海翼精品一区二区三区| 91精品国产自产在线观看永久∴| 欧美日韩亚洲一区三区| 久久亚洲色图| 亚洲精品888| 91精品啪在线观看国产18 | 日韩午夜黄色| 激情婷婷欧美| 欧美日韩四区| 黄色不卡一区| 国产99亚洲| 欧美日韩精品免费观看视频完整| 波多视频一区| 成人免费一区| 色偷偷色偷偷色偷偷在线视频| 欧美少妇精品| 久久视频精品| 午夜欧美在线| 视频一区视频二区在线观看| 久热综合在线亚洲精品| 欧美日韩精品免费观看视频完整| 久久精品主播| 欧美影院三区| 91成人精品视频| 蜜桃久久av一区| 日韩国产欧美在线视频| 日韩美女国产精品| 国产三级精品三级在线观看国产| 日本精品另类| 国产videos久久| 电影亚洲精品噜噜在线观看| 今天的高清视频免费播放成人| 波多野结衣一区| 日本中文字幕一区二区视频 | 国产精东传媒成人av电影| 国产精品免费99久久久| 成人在线免费观看网站| 91精品国产福利在线观看麻豆| 亚洲高清二区| 国产精品一区三区在线观看| 亚洲天堂资源| 亚洲精品乱码| 国产成人精品一区二区三区视频 | 国产高清亚洲| 午夜av一区| 欧美精品91| 视频一区二区不卡| 精品一区电影| 最新国产拍偷乱拍精品| 国产精品日韩精品在线播放| 久久精品国产68国产精品亚洲| 日韩一二三区在线观看| 精品国产亚洲日本| 亚洲综合五月| 999精品一区| 亚洲午夜久久| 在线观看精品| 久久免费福利| 国产精品毛片| 日韩一区三区| 国产精品videosex极品| 亚洲一区二区三区免费在线观看| 久久精品三级| 国产麻豆一区二区三区| 亚洲啊v在线免费视频| 久久久精品网| 国产不卡一区| 国产极品嫩模在线观看91精品| 亚洲丝袜啪啪| 女人天堂亚洲aⅴ在线观看| 日韩av一二三| 日韩一区二区三免费高清在线观看 | 91久久视频| 99tv成人| 久久免费国产| 九九精品调教| 韩国精品主播一区二区在线观看 | 亚洲激情中文在线| 国产一区欧美| 亚洲经典在线| 亚洲日本国产| 91p九色成人| 国产精品自在| 精品72久久久久中文字幕| 欧美综合社区国产| 国产精品va视频| 成人在线黄色| 另类中文字幕国产精品| 亚洲天堂1区| 亚洲性色视频| 国产视频一区在线观看一区免费| 91精品国产福利在线观看麻豆| 99久久精品网站| 夜久久久久久| 日韩精品一级| 国产激情一区| 亚洲电影在线| 日本在线观看不卡视频| 欧美日韩国产一区二区在线观看| 国产精品久久乐| 裤袜国产欧美精品一区| 欧美91视频| 久久国产婷婷国产香蕉| 欧美国产中文高清| 久久在线电影| 国产精品久久久久久久久久久久久久久| 欧美视频久久| 国产黄大片在线观看| 女人av一区| 国产精品手机在线播放| 丝袜美腿一区| 日韩中文av| 九色porny丨国产首页在线| 久久亚洲风情| 久久电影tv| 国产探花一区| 亚洲一区二区三区免费在线观看 | 国产成人1区| 中文字幕亚洲精品乱码| 国产黄色精品| 日韩专区欧美专区| 超碰在线99| 国产精品毛片aⅴ一区二区三区| 伊人久久大香线蕉av不卡| 欧美一级一区| 日韩影院免费视频| 天堂av在线| 国产经典一区| 综合亚洲色图| 香蕉久久久久久久av网站| 国产精品久久久久久久免费观看 | 色8久久久久| 亚洲一区二区动漫| 日韩高清中文字幕一区二区| 国产精品一区亚洲| 日韩精品一二区| 久久精品国产99久久| 91亚洲国产高清| 久久超级碰碰| 国产日韩欧美一区二区三区在线观看 | 国产女优一区| 国产一区91| 国产一级久久| 国产精品丝袜xxxxxxx| 激情欧美丁香| 亚洲激情精品| 蜜臀av国产精品久久久久| 日韩一区二区中文| 日韩免费在线| 在线综合亚洲| 视频一区免费在线观看| 在线看片日韩| 午夜一级久久| 日韩专区在线视频|