日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

瀏覽:203日期:2022-07-14 15:35:50

問題描述

這是報錯信息:

Traceback (most recent call last): File 'D:pypic_downfrom2255ok.py', line 45, in <module> html = getHtml(url_all[i]) File 'D:pypic_downfrom2255ok.py', line 32, in getHtml html = response.read().decode()UnicodeDecodeError: ’utf-8’ codec can’t decode byte 0xb3 in position 184: invalid start byte

改了好多地方,主要可能是目標網站是gb2312編碼,這個程序在別的網站是可以正常下載圖片的,換上現在的網站就有問題還請各位多多指教,問題出在哪里?試了幾個方法都不行源碼如下:爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

#coding=utf-8import urllib.requestfrom urllib.request import urlopen, urlretrieve import urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupurl_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) html = response.read().decode('gbk') return htmldef getImg(html): reg = ’src='http://m.b3g6.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) list=getImg(html.decode()) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath,tempfilename) = os.path.split(file_path)(filename,extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])urllib.request.urlretrieve(imgurl,local)x+=1print('done')

問題解答

回答1:

# coding: utf-8import urllibimport requestsfrom pyquery import PyQuery as Qimport osbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’]for url in url_all: _, file_name = os.path.split(url) dir_name, _ = os.path.splitext(file_name) if not os.path.exists(dir_name):os.mkdir(dir_name) r = requests.get(url) for _ in Q(r.text).find(’img’):src = Q(_).attr(’src’)image_url = src if src.startswith(’http’) else os.path.join(base_url, src)_, image_name = os.path.split(image_url)image_path = os.path.join(dir_name, image_name)urllib.urlretrieve(image_url, image_path)回答2:

首先在你這個代碼里面 local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])中split寫成了splite.

還有 urllib.request.urlretrieve(imgurl,local)這個imgurl不是一個合法的 url,只是一個相對 url, 要改成絕對 url,需要加上 base_url = ’http://www.shop2255.com/’

還有生成的文件路徑好像也有問題.

# -*- coding: utf-8 -*-import urllib.requestfrom urllib.request import urlopen, urlretrieveimport urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) # print(response.read()) html = response.read().decode('gbk') print(html) return htmldef getImg(html): reg = ’src='http://m.b3g6.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre, html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) # 注意: 我這里沒有你那個錯誤,我只需要改這個就行了 # list = getImg(html.decode()) list = getImg(html) # print(list) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath, tempfilename) = os.path.split(file_path)(filename, extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local = r’D:%s%s.jpg’ % (filename, imgurl.split('/')[-1])try: urllib.request.urlretrieve(base_url + imgurl, local)except: print('can’t retrieve the' + base_url + imgurl)x += 1print('done')

標簽: Windows系統 win10
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久激情五月婷婷| 国产欧洲在线| 美美哒免费高清在线观看视频一区二区| 免费成人在线观看| а√天堂中文在线资源8| 日韩中文字幕| 视频一区欧美日韩| 久久青草久久| www.九色在线| 久久久久黄色| 国产精品嫩模av在线| 亚洲激情偷拍| 日韩欧美1区| 国产精品黄网站| 久久久久亚洲| 日本欧美不卡| 欧美中文一区| 亚洲免费播放| 国产一区二区三区精品在线观看 | 国内精品亚洲| 激情欧美国产欧美| 亚洲综合中文| 三上亚洲一区二区| 精品视频一区二区三区在线观看 | 在线精品福利| 欧美黄色一区二区| 不卡中文字幕| 国产伦精品一区二区三区千人斩 | 99久久久久| 日本亚洲视频在线| 老牛影视精品| 日韩在线一区二区| 都市激情国产精品| 日韩一区二区三区高清在线观看| 国产一区二区三区成人欧美日韩在线观看| 国内精品福利| 久久不卡日韩美女| 美女久久网站| 中文在线资源| 国产精品一页| 久久高清国产| 日韩在线综合| 麻豆视频观看网址久久| 中文字幕日韩亚洲| 久久久久网站| 欧美精品aa| 亚洲作爱视频| 日韩精品第一区| 欧美aa在线视频| 亚洲网址在线观看| 日韩精品网站| 美女视频黄免费的久久| 亚洲精品成a人ⅴ香蕉片| 色婷婷精品视频| 麻豆91精品视频| 少妇精品久久久一区二区| 久久中文字幕av| 日本精品黄色| 国产日本亚洲| 日韩一区中文| 丝袜美腿成人在线| sm久久捆绑调教精品一区| 国产欧美日韩视频在线| 久久av一区| 久久精品国产68国产精品亚洲| 国产伦精品一区二区三区视频| 亚洲一区二区av| 国产视频一区在线观看一区免费| 国产精品精品| 成人高清一区| 精品国产一区二区三区噜噜噜| 日韩三区四区| 视频在线观看国产精品| 午夜国产一区二区| 成人久久久久| 在线亚洲人成| 精品视频自拍| 国产精品www.| 久久国产精品免费精品3p| 亚洲精品在线国产| 亚洲字幕久久| 亚洲ab电影| 日本亚洲欧美天堂免费| 免费成人av在线播放| 1024精品久久久久久久久| 久久久久中文| 亚洲天堂成人| 欧美手机在线| 国产尤物精品| 136国产福利精品导航网址| yellow在线观看网址| 国产一区二区三区免费在线| 国产一区二区精品久| 国产一区二区三区网| 国产传媒av在线| 秋霞影视一区二区三区| 99精品视频精品精品视频| 久久九九精品| 欧美日韩国产高清电影| 怡红院精品视频在线观看极品| 欧美一区二区三区激情视频| 激情婷婷久久| 黄色成人91| 中文字幕一区二区三区在线视频| 在线视频亚洲欧美中文| 日本在线不卡视频| 欧美一区二区三区免费看| 国产日韩一区二区三区在线播放| 午夜在线精品偷拍| 色狠狠一区二区三区| 久久免费福利| 亚洲v天堂v手机在线| 日韩中文字幕麻豆| 亚洲精品影院在线观看| 亚洲日产国产精品| 日韩中文字幕| 国产精品极品在线观看| 国产videos久久| 国产综合精品一区| 亚洲免费观看高清完整版在线观| 国产情侣久久| 国产91在线播放精品| 亚洲免费成人| 日韩成人午夜精品| 成人一区而且| 日韩视频免费| 久久国产欧美日韩精品| 另类专区亚洲| 日韩专区欧美专区| 精品淫伦v久久水蜜桃| 亚洲女同中文字幕| 欧美日韩a区| 日韩欧美一区二区三区在线观看| 午夜一级久久| 久久亚洲人体| 最新亚洲激情| 国产精品综合色区在线观看| 黄毛片在线观看| 亚洲精品欧洲| 国产精品字幕| 国产精品亚洲片在线播放| 999久久久91| 国产剧情在线观看一区| 亚洲大片在线| 欧美国产另类| 亚洲色图网站| 韩国精品主播一区二区在线观看| 亚洲精一区二区三区| 91看片一区| 久久国产三级| 午夜一级久久| 成人一区而且| 日韩精品欧美大片| 久久久精品久久久久久96| 国产亚洲观看| 免费久久99精品国产自在现线| 久久精品欧洲| 亚洲精品日本| 91九色精品| 国产一二在线播放| 国产美女视频一区二区| 亚洲综合精品| 欧美sss在线视频| 欧美激情福利| 青青草精品视频| 亚洲黄色影院| 日本不良网站在线观看| 国产精品一卡| 亚洲久久一区| 香蕉视频成人在线观看| 999久久久国产精品| 久久久久伊人| 91精品国产自产精品男人的天堂| 免费看的黄色欧美网站| 久久婷婷av| 91综合网人人| 久久gogo国模啪啪裸体| 日韩欧美久久| 美国欧美日韩国产在线播放| 欧美日韩中文字幕一区二区三区| 精品91福利视频| 日韩av中文在线观看| 伊人精品久久| 午夜在线播放视频欧美| 欧美精选一区二区三区| 日韩欧美国产精品综合嫩v| 精品国产三区在线| 国产精品宾馆| 国产精品久久久久久久久免费高清 | 久久久国产亚洲精品| 免费一级欧美片在线观看网站| 日韩一区二区三免费高清在线观看| 视频在线在亚洲| 先锋亚洲精品| 亚洲欧美日韩国产一区二区| 国产精品丝袜xxxxxxx| 国产视频亚洲| 蜜桃久久久久久| 亚洲免费福利一区| 综合精品一区|