文章詳情頁
python - scrapy 爬取pages比實際進入items的多得多?
瀏覽:166日期:2022-07-23 10:55:26
問題描述

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)
為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么?
問題解答
回答1:重定向了,你看到了吧,重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。
相關文章:
1. java - 判斷數據在數據庫中是否已存在.2. android百度地圖定位問題3. javascript - JS new Date() 保存到 mongodb 中會早8個小時,我們這里是東八區,mongodb 保存的是格林尼治時間4. python - django models 為生成的html元素添加樣式。5. javascript - 關于圣杯布局的一點疑惑6. android - 圖片列表分組之后復用問題7. css - input間的間距和文字上下居中8. nginx bind failed9. 為什么我寫的PHP不行10. android - 有數據要處理的時候如何使用rxJava進行異步處理數據
排行榜

網公網安備