日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Java 5億整數(shù)大文件怎么排序

瀏覽:140日期:2022-09-03 18:08:44

問題

給你1個文件bigdata,大小4663M,5億個數(shù),文件中的數(shù)據(jù)隨機,如下一行一個整數(shù):

61963023557681612158020393452095006174677379343122016371712330287901712966901...7005375

現(xiàn)在要對這個文件進行排序,怎么搞?

內(nèi)部排序

先嘗試內(nèi)排,選2種排序方式:

3路快排:

private final int cutoff = 8;public <T> void perform(Comparable<T>[] a) { perform(a,0,a.length - 1); } private <T> int median3(Comparable<T>[] a,int x,int y,int z) { if(lessThan(a[x],a[y])) { if(lessThan(a[y],a[z])) {return y; } else if(lessThan(a[x],a[z])) {return z; }else {return x; } }else { if(lessThan(a[z],a[y])){return y; }else if(lessThan(a[z],a[x])) {return z; }else {return x; } } } private <T> void perform(Comparable<T>[] a,int low,int high) { int n = high - low + 1; //當序列非常小,用插入排序 if(n <= cutoff) { InsertionSort insertionSort = SortFactory.createInsertionSort(); insertionSort.perform(a,low,high); //當序列中小時,使用median3 }else if(n <= 100) { int m = median3(a,low,low + (n >>> 1),high); exchange(a,m,low); //當序列比較大時,使用ninther }else { int gap = n >>> 3; int m = low + (n >>> 1); int m1 = median3(a,low,low + gap,low + (gap << 1)); int m2 = median3(a,m - gap,m,m + gap); int m3 = median3(a,high - (gap << 1),high - gap,high); int ninther = median3(a,m1,m2,m3); exchange(a,ninther,low); } if(high <= low) return; //lessThan int lt = low; //greaterThan int gt = high; //中心點 Comparable<T> pivot = a[low]; int i = low + 1; /* * 不變式: * a[low..lt-1] 小于pivot -> 前部(first) * a[lt..i-1] 等于 pivot -> 中部(middle) * a[gt+1..n-1] 大于 pivot -> 后部(final) * * a[i..gt] 待考察區(qū)域 */ while (i <= gt) { if(lessThan(a[i],pivot)) {//i-> ,lt ->exchange(a,lt++,i++); }else if(lessThan(pivot,a[i])) {exchange(a,i,gt--); }else{i++; } } // a[low..lt-1] < v = a[lt..gt] < a[gt+1..high]. perform(a,low,lt - 1); perform(a,gt + 1,high); }

歸并排序:

/** * 小于等于這個值的時候,交給插入排序 */ private final int cutoff = 8; /** * 對給定的元素序列進行排序 * * @param a 給定元素序列 */ @Override public <T> void perform(Comparable<T>[] a) { Comparable<T>[] b = a.clone(); perform(b, a, 0, a.length - 1); } private <T> void perform(Comparable<T>[] src,Comparable<T>[] dest,int low,int high) { if(low >= high) return; //小于等于cutoff的時候,交給插入排序 if(high - low <= cutoff) { SortFactory.createInsertionSort().perform(dest,low,high); return; } int mid = low + ((high - low) >>> 1); perform(dest,src,low,mid); perform(dest,src,mid + 1,high); //考慮局部有序 src[mid] <= src[mid+1] if(lessThanOrEqual(src[mid],src[mid+1])) { System.arraycopy(src,low,dest,low,high - low + 1); } //src[low .. mid] + src[mid+1 .. high] -> dest[low .. high] merge(src,dest,low,mid,high); } private <T> void merge(Comparable<T>[] src,Comparable<T>[] dest,int low,int mid,int high) { for(int i = low,v = low,w = mid + 1; i <= high; i++) { if(w > high || v <= mid && lessThanOrEqual(src[v],src[w])) {dest[i] = src[v++]; }else {dest[i] = src[w++]; } } }

數(shù)據(jù)太多,遞歸太深 ->棧溢出?加大Xss? 數(shù)據(jù)太多,數(shù)組太長 -> OOM?加大Xmx?

耐心不足,沒跑出來.而且要將這么大的文件讀入內(nèi)存,在堆中維護這么大個數(shù)據(jù)量,還有內(nèi)排中不斷的拷貝,對棧和堆都是很大的壓力,不具備通用性。

sort命令來跑

sort -n bigdata -o bigdata.sorted

跑了多久呢?24分鐘.

為什么這么慢?

粗略的看下我們的資源: 1. 內(nèi)存 jvm-heap/stack,native-heap/stack,page-cache,block-buffer 2. 外存 swap + 磁盤

數(shù)據(jù)量很大,函數(shù)調(diào)用很多,系統(tǒng)調(diào)用很多,內(nèi)核/用戶緩沖區(qū)拷貝很多,臟頁回寫很多,io-wait很高,io很繁忙,堆棧數(shù)據(jù)不斷交換至swap,線程切換很多,每個環(huán)節(jié)的鎖也很多.

總之,內(nèi)存吃緊,問磁盤要空間,臟數(shù)據(jù)持久化過多導致cache頻繁失效,引發(fā)大量回寫,回寫線程高,導致cpu大量時間用于上下文切換,一切,都很糟糕,所以24分鐘不細看了,無法忍受.

位圖法

private BitSet bits; public void perform( String largeFileName, int total, String destLargeFileName, Castor<Integer> castor, int readerBufferSize, int writerBufferSize, boolean asc) throws IOException { System.out.println('BitmapSort Started.'); long start = System.currentTimeMillis(); bits = new BitSet(total); InputPart<Integer> largeIn = PartFactory.createCharBufferedInputPart(largeFileName, readerBufferSize); OutputPart<Integer> largeOut = PartFactory.createCharBufferedOutputPart(destLargeFileName, writerBufferSize); largeOut.delete(); Integer data; int off = 0; try { while (true) {data = largeIn.read();if (data == null) break;int v = data;set(v);off++; } largeIn.close(); int size = bits.size(); System.out.println(String.format('lines : %d ,bits : %d', off, size)); if(asc) {for (int i = 0; i < size; i++) { if (get(i)) { largeOut.write(i); }} }else {for (int i = size - 1; i >= 0; i--) { if (get(i)) { largeOut.write(i); }} } largeOut.close(); long stop = System.currentTimeMillis(); long elapsed = stop - start; System.out.println(String.format('BitmapSort Completed.elapsed : %dms',elapsed)); }finally { largeIn.close(); largeOut.close(); } } private void set(int i) { bits.set(i); } private boolean get(int v) { return bits.get(v); }

nice!跑了190秒,3分來鐘. 以核心內(nèi)存4663M/32大小的空間跑出這么個結(jié)果,而且大量時間在用于I/O,不錯.

問題是,如果這個時候突然內(nèi)存條壞了1、2根,或者只有極少的內(nèi)存空間怎么搞?

外部排序

該外部排序上場了. 外部排序干嘛的?

內(nèi)存極少的情況下,利用分治策略,利用外存保存中間結(jié)果,再用多路歸并來排序; map-reduce的嫡系.

Java 5億整數(shù)大文件怎么排序

Java 5億整數(shù)大文件怎么排序

1.分

內(nèi)存中維護一個極小的核心緩沖區(qū)memBuffer,將大文件bigdata按行讀入,搜集到memBuffer滿或者大文件讀完時,對memBuffer中的數(shù)據(jù)調(diào)用內(nèi)排進行排序,排序后將有序結(jié)果寫入磁盤文件bigdata.xxx.part.sorted. 循環(huán)利用memBuffer直到大文件處理完畢,得到n個有序的磁盤文件:

Java 5億整數(shù)大文件怎么排序

2.合

現(xiàn)在有了n個有序的小文件,怎么合并成1個有序的大文件? 把所有小文件讀入內(nèi)存,然后內(nèi)排? (⊙o⊙)… no!

利用如下原理進行歸并排序:

Java 5億整數(shù)大文件怎么排序

我們舉個簡單的例子:

文件1:3,6,9 文件2:2,4,8 文件3:1,5,7

第一回合: 文件1的最小值:3 , 排在文件1的第1行 文件2的最小值:2,排在文件2的第1行 文件3的最小值:1,排在文件3的第1行 那么,這3個文件中的最小值是:min(1,2,3) = 1 也就是說,最終大文件的當前最小值,是文件1、2、3的當前最小值的最小值,繞么? 上面拿出了最小值1,寫入大文件.

第二回合: 文件1的最小值:3 , 排在文件1的第1行 文件2的最小值:2,排在文件2的第1行 文件3的最小值:5,排在文件3的第2行 那么,這3個文件中的最小值是:min(5,2,3) = 2 將2寫入大文件.

也就是說,最小值屬于哪個文件,那么就從哪個文件當中取下一行數(shù)據(jù).(因為小文件內(nèi)部有序,下一行數(shù)據(jù)代表了它當前的最小值)

最終的時間,跑了771秒,13分鐘左右.

less bigdata.sorted.text...9999966999996799999689999969999997099999719999972999997399999749999975999997699999779999978...

到此這篇關(guān)于Java 5億整數(shù)大文件怎么排序的文章就介紹到這了,更多相關(guān)Java 大文件排序內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標簽: Java
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
日韩av中文字幕一区二区| 欧洲激情综合| 日韩中文字幕区一区有砖一区| 久久国产毛片| 日本欧美国产| 日韩精品一区二区三区免费观看| 九九色在线视频| 久久久精品久久久久久96 | 在线精品小视频| 亚洲一级二级| 亚洲主播在线| 亚洲人成网站在线在线观看| 视频一区日韩| 欧美日本不卡高清| 少妇精品久久久| 欧美日韩18| 欧美亚洲综合视频| 久久99偷拍| 日产精品一区二区| 亚洲高清二区| 日本少妇一区| 精品国产一区二| 久久久久99| 你懂的国产精品| www在线观看黄色| 欧美1区免费| 一区二区不卡| 国产精品香蕉| 岛国av在线播放| 久久亚洲专区| 亚洲在线久久| 国产一卡不卡| 日韩免费福利视频| 麻豆久久精品| 国产精品久久久久9999高清| 国产传媒av在线| 亚洲一卡久久| 久久超级碰碰| 亚洲无线一线二线三线区别av| 性一交一乱一区二区洋洋av| 日韩不卡一二三区| 国产欧洲在线| 美国三级日本三级久久99 | 日韩三区四区| 精品高清久久| 好吊一区二区三区| 国产精品一区二区av交换| 国产精品久久久久久久久妇女| 激情五月色综合国产精品| 日韩在线麻豆| 九色porny丨国产首页在线| 中文字幕一区二区三区日韩精品| 久久影院一区二区三区| 亚洲免费精品| 国产精品天天看天天狠| 欧美成人国产| 国产精品久久久久久久久久齐齐| 天堂网在线观看国产精品| 国产亚洲欧美日韩精品一区二区三区| 国产精品字幕| 日本亚洲最大的色成网站www | 视频一区中文字幕国产| 国产免费av一区二区三区| 日本蜜桃在线观看视频| 亚州av一区| 欧美性感美女一区二区 | 亚洲欧美一级| 日韩欧美综合| 国产精品探花在线观看| 国产女优一区| 日韩av一级| 免费在线成人| 四虎精品一区二区免费| 性欧美69xoxoxoxo| 成人在线超碰| 日韩av一二三| 欧美jjzz| 高清精品久久| 国产欧美日韩综合一区在线播放| 黄色成人精品网站| 深夜福利视频一区二区| 国产精品亚洲综合久久| 老鸭窝毛片一区二区三区| 日本美女一区| 久久av网站| 欧美日韩一区二区三区不卡视频 | 日韩欧美另类中文字幕| 精品中文一区| 日韩一区二区中文| 欧美日韩亚洲三区| 日本亚洲视频在线| 日韩影院精彩在线| 黄色国产精品| 91精品国产自产在线观看永久∴| 久久久国产精品入口麻豆| 日本欧美韩国一区三区| 国产精品美女| 欧洲在线一区| 91一区二区三区四区| 国产精品日韩精品在线播放| 日韩精品福利一区二区三区| 亚洲女人av| 亚洲欧洲一区| 亚洲神马久久| 久久高清精品| 少妇久久久久| 99久久婷婷这里只有精品| 美女福利一区二区三区| 激情黄产视频在线免费观看| 国产一区二区三区四区二区| 国产精品欧美一区二区三区不卡 | 免费人成精品欧美精品| 好看不卡的中文字幕| 欧美日一区二区| 免费精品国产| 伊人久久亚洲影院| 日韩一区二区免费看| 欧美成人高清| 婷婷久久一区| 夜夜嗨网站十八久久| 婷婷久久一区| 国产精品毛片| 亚洲日本三级| 日韩精彩视频在线观看| 日韩精品乱码av一区二区| 日本欧美在线| 麻豆久久一区二区| 精品三级在线| 激情视频网站在线播放色| 一区二区三区四区日本视频| 都市激情国产精品| 日韩精品水蜜桃| 蜜桃tv一区二区三区| 99久久99久久精品国产片果冰 | 午夜欧美视频| 午夜一级久久| 日本中文字幕不卡| 国产伦乱精品| 精品亚洲a∨一区二区三区18| 91日韩在线| 亚洲激情五月| 午夜视频一区二区在线观看| 奇米色欧美一区二区三区| 国产日韩高清一区二区三区在线| 国产精品久久亚洲不卡| 福利片在线一区二区| 高清不卡亚洲| 免费久久久久久久久| 久久大逼视频| 91欧美极品| 精品国产91| 激情视频一区二区三区| 首页亚洲欧美制服丝腿| 国产欧美一区| 日韩精品中文字幕第1页| 91超碰国产精品| 日韩精选在线| 国内精品亚洲| 国产日韩电影| 久久久精品国产**网站| 国产精品国产一区| 欧美三级精品| 先锋影音久久久| 国产精品99精品一区二区三区∴ | 久久一区欧美| 欧美成人基地| 在线日韩成人| 国产日韩欧美三级| 久久九九精品| 香蕉久久国产| 麻豆一区在线| 99riav1国产精品视频| 欧美亚洲色图校园春色| 日韩电影二区| 亚洲精品动态| 国产精品久久久久久久久久10秀| 国产视频一区免费看| 国产精品第一国产精品| 蜜桃精品在线| 日韩精品亚洲专区| 精品亚洲美女网站| 日韩精品91亚洲二区在线观看| 亚洲午夜天堂| 日韩一区二区三区免费视频| www在线观看黄色| 亚洲久久一区| 日韩欧美一区二区三区免费看| 亚洲精品少妇| 国产美女高潮在线| 日韩不卡一区二区| 欧美日韩一二三四| 美女精品视频在线| 国产亚洲激情| 97精品一区二区| 69堂精品视频在线播放| 午夜久久免费观看| 国产aⅴ精品一区二区三区久久| 免费的成人av| 久久久久99| 国产精品3区|