日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python - 用scrapy爬取網站內容時,如何忽略某些內容為空的值;

瀏覽:188日期:2022-06-28 13:59:25

問題描述

我爬取京東上所有手機信息時會碰到如下問題:1、返回值過多,如下圖片所示:python - 用scrapy爬取網站內容時,如何忽略某些內容為空的值;

2、spider代碼如下:

-- coding: utf-8 --

import scrapyfrom scrapy.http import Requestfrom ueinfo.items import UeinfoItem

class MrueSpider(scrapy.Spider):

name = ’mrue’allowed_domains = [’jd.com’]start_urls = [’http://jd.com/’]def parse(self, response): key='手機' for i in range(1,2):url='https://search.jd.com/Search?keyword='+str(key)+'&enc=utf-8&page='+str((i*2)-1)#print(url)yield Request(url=url,callback=self.page)def page(self,response): #body=response.body.decode('utf-8','ignore') allid=response.xpath('//p[@class=’p-focus’]//a/@data-sku').extract() for j in range(0,len(allid)):thisid=allid[j]url1='https://item.jd.com/'+str(thisid)+'.html'#print(url1)yield Request(url=url1,callback=self.next)def next(self,response): item=UeinfoItem() item['pinpai']=response.xpath('//ul[@id=’parameter-brand’]/li/@title').extract() #print(item['pinpai']) item['xinghao']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’型號’]/following::*[1]').extract() #print(item['xinghao']) item['nianfen']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’上市年份’]/following::*[1]').extract() #print(item['nianfen']) item['yuefen']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’上市月份’]/following::*[1]').extract() #print(item['yuefen']) item['caozuoxt']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’操作系統’]/following::*[1]').extract() #print(item['caozuoxt']) item['cpupp']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU品牌’]/following::*[1]').extract() #print(item['cpupp']) item['cpuhs']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU核數’]/following::*[1]').extract() #print(item['cpuhs']) item['cpuxh']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’CPU型號’]/following::*[1]').extract() #print(item['cpuxh']) item['shuangkalx']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’雙卡機類型’]/following::*[1]').extract() #print(item['shuangkalx']) item['mfnetwangl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’4G網絡’]/following::*[1]').extract() #print(item['mfnetwangl']) item['fnetwangl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’網絡頻率(4G)’]/following::*[1]').extract() #print(item['fnetwangl']) item['netwanglplus']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’指紋識別’]/following::*[1]').extract() #print(item['netwanglplus']) item['volte']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’高清語音通話(VOLTE)’]/following::*[1]').extract() #print(item['volte']) item['screenstyle']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’主屏幕尺寸(英寸)’]/following::*[1]').extract() #print(item['screenstyle']) item['fenbiel']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’分辨率’]/following::*[1]').extract() #print(item['fenbiel']) item['dianchirl']=response.xpath('//p[@class=’Ptable’]//p[@class=’Ptable-item’]//dl//dt[text()=’電池容量(mAh)’]/following::*[1]').extract() #print(item['dianchirl']) yield item

pipelines的代碼如下:

-- coding: utf-8 --

import pymysql

class UeinfoPipeline(object):

def __init__(self): self.conn=pymysql.connect(host='127.0.0.1',user='root',passwd='root',db='mysql')def process_item(self, item, spider): try:pinpai=item['pinpai'][0]xinghao=item['xinghao'][0]nianfen=item['nianfen'][0]yuefen=item['yuefen'][0]caozuoxt=item['caozuoxt'][0]coupp=item['cpupp'][0]cpuhs=item['cpuhs'][0]cpuxh=item['cpuxh'][0]shuangkalx=item['shuangkalx'][0]mfnetwangl=item['mfnetwangl'][0]fnetwangl = item['fnetwangl'][0]netwanglplus=item['netwanglplus'][0]volte=item['volte'][0]screenstyle=item['screenstyle'][0]fenbiel=item['fenbiel'][0]dianchirl=item['dianchirl'][0]sql='insert into uems(pinpai,xinghao,nianfen,yuefen,caozuoxt,cpupp,cpuhs,cpuxh,shuangkalx,mwangluo,fwangluo,wangluoplus,volte,screenstyle,fenbian,dianchi)VALUES(’'+pinpai+'’,’'+xinghao+'’,’'+nianfen+'’,’'+yuefen+'’,’'+caozuoxt+'’,’'+coupp+'’,’'+cpuhs+'’,’'+cpuxh+'’,’'+shuangkalx+'’,’'+mfnetwangl+'’,’'+fnetwangl+'’,’'+netwanglplus+'’,’'+volte+'’,’'+screenstyle+'’,’'+fenbiel+'’,’'+dianchirl+'’)'self.conn.query(sql)#print(mfnetwangl)return item except Exception as err:passdef close_spider(self): self.conn.close()

問題解答

回答1:

pipelines中的

def close方法定義錯誤了

應為這樣

def close(self, spider)

至于忽略某些內容為空的值用for 可能節省代碼!

def process_item(self, item, spider): for k,v in item.items():if v == ’’: raise DropItem(repr(item))

標簽: Python 編程
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产欧美精品| 99香蕉国产精品偷在线观看| 国产欧美精品久久| 91嫩草精品| 国产精品一区二区美女视频免费看 | 激情综合网址| 蜜桃久久久久久| 国产精品色婷婷在线观看| 日韩精品免费一区二区夜夜嗨 | 亚洲国产日韩欧美在线| yellow在线观看网址| 国产一区二区三区成人欧美日韩在线观看| 国产精品1区| 久草免费在线视频| 老司机免费视频一区二区| 99国产成+人+综合+亚洲欧美| 日本成人在线不卡视频| 91国内精品| 美女久久久久久 | 亚洲精品女人| 日本免费在线视频不卡一不卡二| 精品一区二区三区免费看| 午夜国产一区二区| 天堂va蜜桃一区二区三区| 97久久精品| 日韩一区二区中文| 国产亚洲人成a在线v网站| 国产成人免费视频网站视频社区| 国产精品一区二区三区av| 国产精品九九| 欧美精品激情| 精品一区二区三区中文字幕视频| 福利欧美精品在线| 精品99在线| 亚洲国产专区校园欧美| 在线综合视频| 欧美日韩中文| 国产综合色区在线观看| 亚洲在线观看| 午夜一级在线看亚洲| 天堂av在线| 高清av一区| 精品日韩一区| 亚洲综合专区| 欧美jjzz| 国产精品美女| 国产一区国产二区国产三区| 日韩专区欧美专区| 1024精品一区二区三区| 国产精品毛片一区二区在线看| 蜜桃视频在线观看一区| 亚洲免费成人| 亚洲欧洲国产精品一区| 蜜桃免费网站一区二区三区| 99久久婷婷| 国产一区二区三区四区| 日韩成人精品一区| 久久精品国产大片免费观看| 欧美日韩视频免费观看| 亚洲性图久久| 午夜精品免费| 免费在线观看成人| 亚洲深夜av| 日韩一区二区在线免费| 欧美日韩激情| 麻豆91小视频| 蜜桃视频第一区免费观看| 97国产成人高清在线观看| 丝袜美腿亚洲色图| 欧美精品影院| 狠狠干综合网| 精品国产精品久久一区免费式 | 精品国产亚洲日本| 黄色欧美在线| 成人片免费看| 伊人久久亚洲美女图片| 中文日韩欧美| 日韩中文av| 精品成人18| 视频在线观看国产精品| 麻豆一区在线| 视频一区视频二区中文| 国产精品久久国产愉拍| 久久在线免费| 国产精品天堂蜜av在线播放| 激情综合在线| 美女毛片一区二区三区四区最新中文字幕亚洲| 美女网站一区| 国产精品99久久免费观看| 亚洲精品成人| 日韩理论视频| 日韩精品欧美| 国产激情久久| 黑森林国产精品av| 国产精品九九| 国产精品外国| 99免费精品| 欧美日韩亚洲一区二区三区在线| 欧美日韩免费观看一区=区三区| 中文在线а√天堂| 另类综合日韩欧美亚洲| 欧美日一区二区在线观看| 日韩一区欧美二区| 国产一区二区三区久久| 亚洲一区久久| 亚洲激情社区| 国产v综合v| 麻豆国产精品| 中文字幕一区久| 69堂免费精品视频在线播放| 亚洲激情二区| 日韩中文首页| 国产精品亚洲人成在99www| 久久亚洲欧美| 欧美另类专区| 亚洲欧美日韩在线观看a三区| 九九久久电影| 欧美a级片一区| 亚洲经典在线| 在线免费观看亚洲| 视频一区国产视频| 视频在线观看国产精品| 视频在线观看国产精品| 日韩三级精品| 午夜日韩福利| 国产精品三级| 精品亚洲免a| 午夜国产一区二区| 婷婷亚洲综合| 视频一区中文字幕精品| 韩日一区二区三区| 欧美三级网址| 国内亚洲精品| 欧美理论视频| 天堂成人国产精品一区| 蘑菇福利视频一区播放| 亚洲在线免费| 日韩欧美国产精品综合嫩v| 午夜av成人| 六月天综合网| 亚洲精一区二区三区| 亚洲一二av| 日韩激情综合| 日韩一区网站| 国产精品手机在线播放| 精品国产亚洲一区二区三区| www.51av欧美视频 | 精品国产中文字幕第一页| 久久亚洲资源中文字| аⅴ资源天堂资源库在线| 久久久久久久久丰满| 久久亚洲国产精品一区二区| 免费亚洲婷婷| 欧美色图一区| 精品网站999| 亚洲ab电影| 国产精品99久久免费观看| 蜜桃视频一区二区| 精品视频一区二区三区在线观看| 亚洲一级在线| 欧美国产亚洲精品| 精品午夜久久| 涩涩涩久久久成人精品| 免费日韩av片| 91午夜精品| 在线亚洲人成| 蜜桃久久av一区| 欧美日韩视频免费看| 国产精品亚洲二区| 中文字幕色婷婷在线视频| 99视频精品视频高清免费| 蜜臀91精品国产高清在线观看| 久久最新视频| 99精品在线观看| 国产欧美大片| 亚洲精品国产日韩| 色婷婷精品视频| 在线亚洲人成| 成人av三级| 亚洲女同av| 欧美激情麻豆| 国产精品久久久久久久久久白浆 | 日韩精品一区二区三区免费观看| 日韩一区免费| 美女网站一区| 亚洲国产专区校园欧美| 亚洲一区免费| 在线视频观看日韩| 国产日韩欧美一区在线| 亚洲色图国产| 国产欧美日韩一级| 一区二区三区国产在线| 国产精品宾馆| 亚洲男女自偷自拍| 精品久久久久中文字幕小说| 亚洲在线电影| 国产传媒在线观看| 亚洲深夜福利在线观看| 色综合狠狠操| 日本中文字幕一区二区视频|