日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

python - 大文本數據合并問題思路

瀏覽:162日期:2022-08-12 15:46:37

問題描述

背景:

我有三個csv文件,分別如下:

afile: userid, username, ....bfile: postid, userid, postname, ...cfile: postid, postnum, ...

afile = 10Gbfile = 150Gcfile = 20G

注:各個field的分隔符并不是單個字符(例如逗號),而是一串特殊符號,因為部分field可能會包含某些單字符分隔符,鍵盤上的單字符都試過了,都有包含,所以用了一串幾個字符組成的特殊字符串來分隔,所以并不是嚴格的csv,這是最蛋疼的地方

目的:

我想合并這三個文件,bfile和cfile根據postid列合并,合并后再根據userid列合并afile,最終大概是postid, userid, postname, postnum, username這樣的形式。

目前我的偽代碼如下:

import pandas as pdchunksize = 1000000 # 100W 目前看沒問題 try:resultchunktotal = []bfilereader = pd.read_csv(bfile, iterator=True, engine=’python’, sep=’##’)goon_1 = Truewhile goon_1: try:# 分塊讀取 bfilebfilechunk = bfilereader.get_chunk(chunksize)if not bfilechunk.empty: cfilereader = pd.read_csv(cfile, iterator=True, engine=’python’, sep=’##’) goon_2 = True while goon_2:try: # 分塊讀取 cfile cfilechunk = cfilereader.get_chunk(chunksize) if not cfilechunk.empty:bfilecfilechunk = pd.merge(bfilechunk, cfilechunk, on=’postid’)# 不為空代表 bfile cfile有共同的postidif not bfilecfilechunk.empty: afilereader = pd.read_csv(afile, iterator=True, engine=’python’, sep=’##’) goon_3 = True while goon_3:try: # 分塊讀取afile afilechunk = afilereader.get_chunk(chunksize) if not afilechunk.empty:chunkresult = pd.merge(bfilecfilechunk, afilechunk, on=’’)# 不為空表示有共同的useridif not chunkresult.empty:resultchunktotal.append(chunkresult)except StopIteration: goon_3 = Falseexcept StopIteration: goon_2 = False except StopIteration:goon_1 = Falseif len(resultchunktotal) > 0: pd.concat(resultchunktotal).to_csv(’result.csv’, index=False) except Exception as e:print(e)

但是感覺這樣,很低效,所以跪求各位大神好的思路以及好的工具方法

ps: 這是一道“大數據”的偽命題,無非數據稍大了點

問題解答

回答1:

別寫代碼啦。看起來是一行 shell 腳本的事情,用 xsv join 子命令。

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
日本久久黄色| 99视频精品| 亚洲一区二区三区久久久| 亚洲尤物在线| 性一交一乱一区二区洋洋av| 久久高清免费观看| 日韩动漫一区| 国产精品白丝av嫩草影院| 国产aa精品| 欧美美女一区| 天堂精品久久久久| 国产精品自在| 日韩电影二区| 亚洲一区免费| 91成人精品在线| 国产精品二区不卡| 日韩啪啪电影网| 一区视频在线| 欧美自拍一区| 国产成人精品一区二区三区视频| 久久国产直播| 91精品丝袜国产高跟在线| 福利视频一区| 伊人久久亚洲美女图片| 日韩不卡手机在线v区| 韩国女主播一区二区三区| 久久久久久免费视频| 伊人久久亚洲| yellow在线观看网址| 另类国产ts人妖高潮视频| 麻豆精品新av中文字幕| 免费不卡中文字幕在线| 国产色噜噜噜91在线精品| 日韩av首页| 日韩美女精品| 久久久五月天| 久久国产人妖系列| 亚洲女同中文字幕| 国产精品伦一区二区| 欧美日韩一区二区三区视频播放| 日韩精品五月天| 欧美丝袜一区| 欧美日韩一区二区国产| 蜜桃国内精品久久久久软件9| 日韩欧美精品一区二区综合视频| 成人小电影网站| 日韩一区二区三区精品视频第3页| 97国产精品| 在线免费观看亚洲| 岛国av免费在线观看| 日本在线视频一区二区| 欧美99久久| 久久久久亚洲精品中文字幕| 亚洲涩涩av| 香蕉久久99| 国产成人精品一区二区免费看京| 日韩精品电影一区亚洲| 91国语精品自产拍| 成人国产精品一区二区网站| 日本aⅴ免费视频一区二区三区| 激情婷婷综合| 91欧美国产| 欧美国产另类| 日韩av不卡在线观看| 久久一二三区| 99精品在线免费在线观看| 国产精品亚洲四区在线观看| 最新亚洲国产| 性色一区二区| 黄色成人精品网站| 99久久久久久中文字幕一区| 91视频精品| 久久精品国产亚洲aⅴ| 日韩精品一区二区三区中文在线| 精品在线91| 另类中文字幕国产精品| 麻豆一区在线| 国产精品一区2区3区| 亚久久调教视频| 麻豆9191精品国产| 日韩一级网站| 欧美精品激情| 久久一级电影| 久久精品123| 久久精品观看| 91精品国产乱码久久久久久久| 日韩中文字幕高清在线观看| 91一区二区三区四区| 水蜜桃久久夜色精品一区| 国产一区二区精品福利地址| 欧美激情福利| 国产精品手机在线播放| 日韩高清不卡一区| 青草久久视频| 青草国产精品久久久久久| 欧美一区=区三区| 国产情侣久久| 久久尤物视频| 国产美女高潮在线观看| 正在播放日韩精品| 1024精品一区二区三区| 激情五月色综合国产精品| 夜夜嗨av一区二区三区网站四季av| 精品中文字幕一区二区三区av| 亚洲男女av一区二区| 视频一区二区三区中文字幕| 美美哒免费高清在线观看视频一区二区 | 亚洲播播91| 中文字幕系列一区| 欧美日韩国产欧| 亚洲色图综合| 国产精品magnet| 激情国产在线| 亚洲精品一区二区妖精| 一区二区精品| 久久中文字幕一区二区| 免费污视频在线一区| 性色一区二区| 国产日韩一区二区三区在线| 久久福利在线| 亚洲www啪成人一区二区| 久久久国产亚洲精品| 免费欧美日韩| 国产欧美日韩| 丝袜美腿诱惑一区二区三区 | 99国产精品| 日韩国产欧美三级| 精品视频高潮| 亚洲国产日韩欧美在线| 亚洲在线一区| 国产精品激情| 欧美成人精品| 国产日韩一区| 久久蜜桃资源一区二区老牛| 在线精品一区二区| 成人精品视频| 亚洲乱码久久| 色在线视频观看| 午夜久久av| 国产色播av在线| 亚洲精品美女| 免费在线小视频| 日韩va欧美va亚洲va久久| 亚洲四虎影院| 色8久久久久| 日韩免费福利视频| 91精品在线免费视频| 久久久成人网| 国产美女视频一区二区| 青青久久av| 国产欧美69| 国产精品社区| 国产成人精品亚洲线观看 | 精品国产日韩欧美精品国产欧美日韩一区二区三区 | 三上亚洲一区二区| 三级欧美在线一区| аⅴ资源天堂资源库在线| 亚洲久久视频| 欧美一区二区性| 欧美aⅴ一区二区三区视频| 国产中文一区| 精品国产中文字幕第一页| 免费精品视频最新在线| 国产一区二区三区探花| 婷婷精品在线| 性色一区二区| 久久久久99| 老司机精品视频网| 天堂精品久久久久| 国产精品人人爽人人做我的可爱| 亚洲最新无码中文字幕久久| 国产伦理久久久久久妇女| 91成人精品视频| 精品欧美一区二区三区在线观看| 国产精品网址| 亚洲精品在线国产| 亚洲精品中文字幕乱码| 色婷婷久久久| 国产96在线亚洲| 国产精品色在线网站| 亚洲区国产区| 久久国产高清| 国产亚洲永久域名| 国产一区日韩欧美| 九九色在线视频| 成人国产精品一区二区免费麻豆| 国产精品白丝一区二区三区| 欧美一区网站| 欧美在线黄色| 欧美日本不卡| 日精品一区二区三区| 亚洲精品综合| 亚洲天堂免费| 亚洲人成精品久久久| 亚洲精选91| 日韩激情视频网站| 91福利精品在线观看| 91精品福利观看| 国产欧美亚洲一区| 国产精品久久久一区二区|