日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python - Scrapy模擬登陸遇到404問題

瀏覽:152日期:2022-06-30 17:56:24

問題描述

用python模擬登陸一個網站,一直遇到404問題,求指導!

代碼

-- coding: utf-8 --

import scrapyfrom scrapy.http import Request, FormRequestfrom scrapy.selector import Selector

class StackSpiderSpider(scrapy.Spider):

name = 'stack_spider'start_urls = [’https://stackoverflow.com/’]headers = { 'host': 'cdn.sstatic.net', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Encoding': 'gzip, deflate, br', 'Accept-Language': 'en-US,en;q=0.5', 'Connection': 'keep-alive', 'Content-Type':' application/x-www-form-urlencoded; charset=UTF-8', 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:54.0) Gecko/20100101 Firefox/54.0' }#重寫了爬蟲類的方法, 實現了自定義請求, 運行成功后會調用callback回調函數def start_requests(self) : return [Request('https://stackoverflow.com/users/login', meta = { # ’dont_redirect’: True, # ’handle_httpstatus_list’: [302], ’cookiejar’ : 1}, callback = self.post_login)] #添加了meta#FormRequesetdef post_login(self, response) : # 請求網頁后返回網頁中的_xsrf字段的文字, 用于成功提交表單 fkey = Selector(response).xpath(’//input[@name='fkey']/@value’).extract()[0] ssrc = Selector(response).xpath(’//input[@name='ssrc']/@value’).extract()[0] print fkey print ssrc #FormRequeset.from_response是Scrapy提供的一個函數, 用于post表單 #登陸成功后, 會調用after_login回調函數 return [FormRequest.from_response(response, meta = {# ’dont_redirect’: True,# ’handle_httpstatus_list’: [302],’cookiejar’ : response.meta[’cookiejar’]}, #注意這里cookie的獲取headers = self.headers,formdata = {'fkey':fkey,'ssrc':ssrc,'email':'1045608243@qq.com','password':'12345','oauth_version':'','oauth_server':'','openid_username':'','openid_identifier':''},callback = self.after_login,dont_filter = True)]def after_login(self, response) : filename = '1.html' with open(filename,’wb’) as fp:fp.write(response.body) # print response.body

調試信息2017-04-18 11:19:23 [scrapy.utils.log] INFO: Scrapy 1.3.3 started (bot: text5)2017-04-18 11:19:23 [scrapy.utils.log] INFO: Overridden settings: {’NEWSPIDER_MODULE’: ’text5.spiders’, ’SPIDER_MODULES’: [’text5.spiders’], ’BOT_NAME’: ’text5’}2017-04-18 11:19:23 [scrapy.middleware] INFO: Enabled extensions:[’scrapy.extensions.logstats.LogStats’, ’scrapy.extensions.telnet.TelnetConsole’, ’scrapy.extensions.corestats.CoreStats’]2017-04-18 11:19:24 [scrapy.middleware] INFO: Enabled downloader middlewares:[’scrapy.downloadermiddlewares.httpauth.HttpAuthMiddleware’, ’scrapy.downloadermiddlewares.downloadtimeout.DownloadTimeoutMiddleware’, ’scrapy.downloadermiddlewares.defaultheaders.DefaultHeadersMiddleware’, ’scrapy.downloadermiddlewares.useragent.UserAgentMiddleware’, ’scrapy.downloadermiddlewares.retry.RetryMiddleware’, ’scrapy.downloadermiddlewares.redirect.MetaRefreshMiddleware’, ’scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware’, ’scrapy.downloadermiddlewares.redirect.RedirectMiddleware’, ’scrapy.downloadermiddlewares.cookies.CookiesMiddleware’, ’scrapy.downloadermiddlewares.stats.DownloaderStats’]2017-04-18 11:19:24 [scrapy.middleware] INFO: Enabled spider middlewares:[’scrapy.spidermiddlewares.httperror.HttpErrorMiddleware’, ’scrapy.spidermiddlewares.offsite.OffsiteMiddleware’, ’scrapy.spidermiddlewares.referer.RefererMiddleware’, ’scrapy.spidermiddlewares.urllength.UrlLengthMiddleware’, ’scrapy.spidermiddlewares.depth.DepthMiddleware’]2017-04-18 11:19:24 [scrapy.middleware] INFO: Enabled item pipelines:[]2017-04-18 11:19:24 [scrapy.core.engine] INFO: Spider opened2017-04-18 11:19:24 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)2017-04-18 11:19:24 [scrapy.extensions.telnet] DEBUG: Telnet console listening on 127.0.0.1:60232017-04-18 11:19:24 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://stackoverflow.com/users/login> (referer: None)1145f3f2e28e56c298bc28a1a735254b

2017-04-18 11:19:25 [scrapy.core.engine] DEBUG: Crawled (404) <GET https://stackoverflow.com/search?q=&ssrc=&openid_username=&oauth_server=&oauth_version=&fkey=1145f3f2e28e56c298bc28a1a735254b&password=wanglihong1993&email=1067863906%40qq.com&openid_identifier=> (referer: https://stackoverflow.com/use...2017-04-18 11:19:25 [scrapy.spidermiddlewares.httperror] INFO: Ignoring response <404 https://stackoverflow.com/sea...auth_version=&fkey=1145f3f2e28e56c298bc28a1a735254b&password=wanglihong1993&email=1067863906%40qq.com&openid_identifier=>: HTTP status code is not handled or not allowed2017-04-18 11:19:25 [scrapy.core.engine] INFO: Closing spider (finished)2017-04-18 11:19:25 [scrapy.statscollectors] INFO: Dumping Scrapy stats:{’downloader/request_bytes’: 881, ’downloader/request_count’: 2, ’downloader/request_method_count/GET’: 2, ’downloader/response_bytes’: 12631, ’downloader/response_count’: 2, ’downloader/response_status_count/200’: 1, ’downloader/response_status_count/404’: 1, ’finish_reason’: ’finished’, ’finish_time’: datetime.datetime(2017, 4, 18, 3, 19, 25, 143000), ’log_count/DEBUG’: 3, ’log_count/INFO’: 8, ’request_depth_max’: 1, ’response_received_count’: 2, ’scheduler/dequeued’: 2, ’scheduler/dequeued/memory’: 2, ’scheduler/enqueued’: 2, ’scheduler/enqueued/memory’: 2, ’start_time’: datetime.datetime(2017, 4, 18, 3, 19, 24, 146000)}2017-04-18 11:19:25 [scrapy.core.engine] INFO: Spider closed (finished)

問題解答

回答1:

老弟,你的密碼泄漏了

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久精品国产68国产精品亚洲| 日韩视频一区| 综合国产在线| 天堂va蜜桃一区二区三区| 欧美精品一线| 亚洲综合欧美| 美女精品在线| 亚洲三级精品| 亚洲2区在线| 国产另类在线| 日韩高清在线不卡| 欧美日韩xxxx| 国产精品麻豆成人av电影艾秋| 国产精品亚洲四区在线观看 | 中文字幕亚洲精品乱码| 蜜桃视频一区二区三区在线观看 | 久久亚洲色图| 日韩欧美激情| 国产精品国码视频| 日韩av自拍| 亚洲韩日在线| 丝袜美腿亚洲一区二区图片| 亚洲欧洲日韩精品在线| 日韩不卡手机在线v区| 欧美国产日韩电影| a日韩av网址| 狠狠久久婷婷| 日韩二区三区四区| 久久精品国产网站| 欧美日韩水蜜桃| 蜜臀国产一区二区三区在线播放 | 婷婷成人基地| 亚久久调教视频| 国产欧美日韩影院| 日韩av自拍| 久久午夜精品一区二区| 久久国产乱子精品免费女| 精品视频久久| 激情五月综合网| 日韩成人午夜精品| 波多野结衣久久精品| 日韩天堂av| 国产欧美一区二区精品久久久| 日韩精品不卡一区二区| 综合亚洲色图| 日本一二区不卡| 香蕉久久夜色精品国产| 国产精品蜜月aⅴ在线| 精品亚洲a∨| 在线综合视频| 久久av资源| 99国产精品私拍| 国产精品久久| 91成人精品| 国产精品入口久久| 国产精品88久久久久久| 国产精品久久久久久模特| 久久精品高清| 欧美日韩一区自拍| 久久美女精品| 亚洲日本三级| 国产精品亚洲一区二区三区在线观看| 亚洲制服一区| 老司机免费视频一区二区| 九九久久电影| 国产一区一一区高清不卡| 久久国产精品久久w女人spa| 麻豆成人av在线| 视频一区视频二区中文字幕| 久久精品国产999大香线蕉| 99综合视频| 日韩欧美一区二区三区在线视频| 日韩欧美在线精品| 日韩一区二区三区免费| 欧美日本不卡| 亚洲精品中文字幕乱码| 狂野欧美性猛交xxxx| 视频一区中文字幕| 精品中国亚洲| 蜜臀91精品一区二区三区| 亚洲国产福利| 国产精品永久| 亚洲精品大全| 黄色不卡一区| 日韩精品免费一区二区在线观看| 国产精品亚洲产品| 日本欧洲一区二区| 欧美丝袜一区| 91欧美日韩| 国产精品3区| 亚洲精品系列| 在线亚洲自拍| 亚洲91视频| 老鸭窝一区二区久久精品| 婷婷综合国产| 日韩中文字幕不卡| 亚洲国内精品| 久久精选视频| 成人三级高清视频在线看| 青草国产精品久久久久久| 午夜在线一区| 欧美特黄视频| 精品欧美激情在线观看| 日韩精品一区二区三区免费观看| 精品免费视频| 久久精品国产福利| 久久影视三级福利片| 欧美日韩一区二区国产| 丝袜亚洲精品中文字幕一区| 91九色精品| 五月天综合网站| 日韩精品水蜜桃| 欧洲av一区二区| 久久天堂av| 91亚洲自偷观看高清| 久久99国产精品视频| 欧美黄页在线免费观看| 国产精品密蕾丝视频下载| 日韩不卡手机在线v区| 午夜亚洲福利| 日韩欧美四区| 欧美欧美黄在线二区| 国产精品入口久久| 久久99青青| 久久亚洲人体| 国际精品欧美精品| 天堂√中文最新版在线| 成人精品久久| 亚洲精品88| 99久久99视频只有精品| 天堂资源在线亚洲| 香蕉国产精品| 男女性色大片免费观看一区二区 | 免费一区二区视频| 中国女人久久久| 综合激情在线| 日本aⅴ免费视频一区二区三区| 69堂精品视频在线播放| 国产日韩欧美一区二区三区在线观看| 日本欧美在线| 欧美激情福利| 成人小电影网站| 久久高清免费| 蜜臀久久99精品久久久画质超高清| 亚洲视频国产精品| 欧美亚洲国产日韩| 免费一级欧美片在线观看网站| 久久精品国产一区二区| 在线人成日本视频| 亚洲不卡系列| 中文精品电影| 日本91福利区| 久久在线91| 99久久久久久中文字幕一区| av成人国产| 国产日韩视频在线| 亚洲啊v在线| 蜜臀国产一区二区三区在线播放| 亚洲精品九九| 你懂的国产精品永久在线| 免费看av不卡| 免费高清在线一区| 国产精品成人一区二区网站软件| 国产999精品在线观看| 欧美69视频| 日本精品在线播放| 国产精品成人a在线观看| 黄色在线一区| 欧美日韩精品一区二区三区视频| 成人亚洲一区二区| 久久国产精品亚洲77777| 国产欧美精品久久| 丝袜诱惑一区二区| 亚洲五月综合| 国产成人精品福利| 国产一区导航| 麻豆一区二区三| 女人av一区| 国产欧美日韩视频在线| 欧美日韩一二三四| 欧美日韩a区| 成人久久一区| 日本欧美久久久久免费播放网| 日韩国产欧美| 日韩精品免费观看视频| 欧美13videosex性极品| 亚洲人成亚洲精品| 日韩精品诱惑一区?区三区| 免费看欧美美女黄的网站| 精品一区二区三区的国产在线观看| 野花国产精品入口| 国产成人精品福利| 亚洲无线观看| 最新中文字幕在线播放| 亚洲精品第一| 激情综合亚洲| 国产精品成人一区二区网站软件| 91九色精品| 98精品久久久久久久| 日韩av网站免费在线|