日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

Python用多進程寫文件遇到編碼問題,而用多線程卻不會

瀏覽:213日期:2022-06-28 13:29:55

問題描述

用多進程爬取數據寫入文件,運行沒有報錯,但是打開文件卻亂碼。Python用多進程寫文件遇到編碼問題,而用多線程卻不會

Python用多進程寫文件遇到編碼問題,而用多線程卻不會

用多線程改寫時卻沒有這個問題,一切正常。下面是數據寫入文件的代碼:

def Get_urls(start_page,end_page): print ’ run task {} ({})’.format(start_page,os.getpid()) url_text = codecs.open(’url.txt’,’a’,’utf-8’)for i in range(start_page,end_page+1): pageurl=baseurl1+str(i)+baseurl2+searchword response = requests.get(pageurl, headers=header) soup = BeautifulSoup(response.content, ’html.parser’) a_list=soup.find_all(’a’) for a in a_list:if a.text!=’’and ’wssd_content.jsp?bookid’in a[’href’]: text=a.text.strip() url=baseurl+str(a[’href’]) url_text.write(text+’t’+url+’n’)url_text.close()

多進程用的進程池

def Multiple_processes_test(): t1 = time.time() print ’parent process {} ’.format(os.getpid()) page_ranges_list = [(1,3),(4,6),(7,9)] pool = multiprocessing.Pool(processes=3) for page_range in page_ranges_list:pool.apply_async(func=Get_urls,args=(page_range[0],page_range[1])) pool.close() pool.join() t2 = time.time() print ’時間:’,t2-t1

問題解答

回答1:

圖片上已經說了,文件以錯誤的編碼形式載入了,說明你多進程寫入的時候,編碼不是utf-8

回答2:

文件第一行添加:

#coding: utf-8回答3:

打開同一個文件,相當危險,出錯機率相當大,多線程不出錯,極有可能是GIL,多進程沒有鎖,因此容易出錯了。

url_text = codecs.open(’url.txt’,’a’,’utf-8’)

建議改為生產者消費都模式!

比如這樣

# -*- coding: utf-8 -* -import timeimport osimport codecsimport multiprocessingimport requestsfrom bs4 import BeautifulSoupbaseurl = ’’baseurl1 = ’’baseurl2 = ’’pageurl = ’’searchword = ’’header = {}def fake(url, **kwargs): class Response(object):pass o = Response() o.content = ’<a href='http://m.b3g6.com/{}/wssd_content.jsp?bookid'>foo</a>’.format(url) return orequests.get = fakedef Get_urls(start_page, end_page, queue): print(’run task {} ({})’.format(start_page, os.getpid())) try:for i in range(start_page, end_page + 1): pageurl = baseurl1 + str(i) + baseurl2 + searchword response = requests.get(pageurl, headers=header) soup = BeautifulSoup(response.content, ’html.parser’) a_list = soup.find_all(’a’) for a in a_list:if a.text != ’’and ’wssd_content.jsp?bookid’in a[’href’]: text = a.text.strip() url = baseurl + str(a[’href’]) queue.put(text + ’t’ + url + ’n’) except Exception as e:import tracebacktraceback.print_exc()def write_file(queue): print('start write file') url_text = codecs.open(’url.txt’, ’a’, ’utf-8’) while True:line = queue.get()if line is None: breakprint('write {}'.format(line))url_text.write(line) url_text.close()def Multiple_processes_test(): t1 = time.time() manager = multiprocessing.Manager() queue = manager.Queue() print ’parent process {} ’.format(os.getpid()) page_ranges_list = [(1, 3), (4, 6), (7, 9)] consumer = multiprocessing.Process(target=write_file, args=(queue,)) consumer.start() pool = multiprocessing.Pool(processes=3) results = [] for page_range in page_ranges_list:result = pool.apply_async(func=Get_urls, args=(page_range[0], page_range[1], queue ))results.append(result) pool.close() pool.join() queue.put(None) consumer.join() t2 = time.time() print ’時間:’, t2 - t1if __name__ == ’__main__’: Multiple_processes_test()結果

foo /4/wssd_content.jsp?bookidfoo /5/wssd_content.jsp?bookidfoo /6/wssd_content.jsp?bookidfoo /1/wssd_content.jsp?bookidfoo /2/wssd_content.jsp?bookidfoo /3/wssd_content.jsp?bookidfoo /7/wssd_content.jsp?bookidfoo /8/wssd_content.jsp?bookidfoo /9/wssd_content.jsp?bookid

標簽: Python 編程
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产一区亚洲| 精品一区二区三区中文字幕| 国内自拍视频一区二区三区| 国产极品模特精品一二| 麻豆国产精品一区二区三区| 高清日韩中文字幕| 日本欧美不卡| 中文精品在线| 日本99精品| 久久精品九色| av高清不卡| 欧美日韩在线观看视频小说| 国产日韩综合| 国产精品免费99久久久| 四虎884aa成人精品最新| 国产亚洲精品v| 国产日韩欧美三区| 丝袜美腿诱惑一区二区三区| 自由日本语亚洲人高潮| 中文字幕中文字幕精品| 国产中文欧美日韩在线| 天堂av在线| 欧美性www| 日韩不卡手机在线v区| 国产精品s色| 美女久久久久久| 欧美1级日本1级| 欧美激情视频一区二区三区免费 | 日韩精品一区二区三区av | 美女黄网久久| 久久精品国产99国产精品| 久久精品国产亚洲夜色av网站| 香蕉久久国产| 亚洲综合在线电影| 麻豆91小视频| 亚洲精品黄色| 亚洲免费观看| 国产一区二区三区精品在线观看| 亚洲精品美女91| 欧美a级片一区| 高清一区二区三区| 你懂的国产精品| 日本少妇一区二区| 蜜臀av国产精品久久久久| 五月激情久久| 国产成人精品亚洲线观看 | 国产九一精品| 日韩精品国产精品| 亚洲资源网站| 蜜臀精品一区二区三区在线观看| japanese国产精品| 久久九九精品| 99tv成人| 日韩综合在线| 日韩一区欧美| 精品亚洲美女网站| 久久久人人人| japanese国产精品| 国产精品7m凸凹视频分类| 日本蜜桃在线观看视频| 久久久久久色 | 91精品国产一区二区在线观看| 丝袜美腿成人在线| 亚洲一区二区三区无吗| 日韩精品高清不卡| 精品国产中文字幕第一页| 91亚洲人成网污www| 久久爱www成人| 色偷偷色偷偷色偷偷在线视频| 青青久久av| 日韩专区一卡二卡| 青青草精品视频| 国产精区一区二区| 日韩影院二区| 亚洲精品综合| 国产一区二区三区视频在线| 亚洲手机在线| 91精品国产自产在线丝袜啪| 麻豆久久久久久| 欧美亚洲激情| 国产午夜久久av| 亚洲欧洲高清| 亚洲资源网站| 香蕉成人av| 久久激五月天综合精品| 欧美三级网址| 青青草国产成人99久久| 国产不卡一区| 中文字幕一区二区三区日韩精品 | 欧美国产三级| 在线视频免费在线观看一区二区| 日韩在线观看中文字幕| 亚洲精品在线影院| 国产日韩免费| 好看的av在线不卡观看| 国产欧美日韩免费观看| 在线午夜精品| 深夜视频一区二区| 国产精品免费不| 亚洲尤物在线| 日韩av免费| 不卡专区在线| 国产精品乱战久久久| 一本一道久久a久久| 亚洲婷婷免费| 国产成人调教视频在线观看| 国产日韩欧美一区在线| 婷婷综合成人| 婷婷精品在线| 中文字幕成人| 在线免费观看亚洲| 亚洲免费在线| 欧美在线网站| 久久亚洲精品中文字幕蜜潮电影| 国产精品一区二区三区www| 久久亚洲视频| 日韩一级精品| 国产高潮在线| 影音国产精品| 亚洲丝袜啪啪| 石原莉奈在线亚洲二区| 日韩不卡一区二区| 视频二区不卡| 日韩成人午夜精品| 天堂а√在线最新版中文在线| 日韩亚洲国产欧美| 精品亚洲a∨一区二区三区18| 欧美~级网站不卡| 国产精品欧美大片| 日韩美女一区二区三区在线观看| 欧美日韩精品免费观看视欧美高清免费大片| 视频一区中文| 国产一区二区三区四区五区| 亚洲欧美网站| 在线中文字幕播放| 日韩有吗在线观看| 国产精品一级| 日产精品一区二区| 女主播福利一区| 伊人久久大香伊蕉在人线观看热v| 青草国产精品| 亚洲午夜视频| 国产亚洲观看| 黑丝美女一区二区| 日本一区福利在线| 国内精品亚洲| 中文字幕一区二区三区日韩精品 | 国产一区精品福利| 91久久在线| 精品美女久久| 亚洲精品乱码日韩| 久久在线电影| 国产一区二区三区日韩精品| 亚洲免费福利一区| 国产亚洲激情| 天堂中文在线播放| 国产区精品区| 中文不卡在线| 日韩天堂av| 一本大道色婷婷在线| 国产伦精品一区二区三区千人斩| 蜜臀国产一区| 久久av超碰| 欧美日韩一区二区三区四区在线观看| 1024精品一区二区三区| 日韩av福利| 精品三级av| 免费一级欧美在线观看视频| 日韩精品91亚洲二区在线观看| 亚洲一区二区动漫| 日韩精品午夜| www在线观看黄色| 丰满少妇一区| 精品不卡一区| 久久精品国产久精国产| 国产精品久一| 久久精品毛片| 精品一区av| 电影91久久久| 成人欧美一区二区三区的电影| 精品美女久久| 中文在线а√在线8| 91看片一区| 亚洲一区日韩| 99在线|亚洲一区二区| 欧美99久久| 丝袜美腿一区二区三区| 日本一不卡视频| 国产精品xvideos88| 精品亚洲a∨一区二区三区18| 日韩精品dvd| 久色成人在线| 国产欧美精品久久| 捆绑调教日本一区二区三区| 欧美日韩色图| 亚洲精品自拍| 国产suv精品一区二区四区视频 | 成人欧美一区二区三区的电影| 日韩精品dvd| 中文无码久久精品|