日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Python實(shí)現(xiàn)GPU加速的基本操作

瀏覽:113日期:2022-08-07 08:33:11
目錄CUDA的線程與塊用GPU打印線程編號(hào)用GPU打印塊編號(hào)用GPU打印塊的維度用GPU打印線程的維度總結(jié)GPU所支持的最大并行度GPU的加速效果總結(jié)概要CUDA的線程與塊

GPU從計(jì)算邏輯來講,可以認(rèn)為是一個(gè)高并行度的計(jì)算陣列,我們可以想象成一個(gè)二維的像圍棋棋盤一樣的網(wǎng)格,每一個(gè)格子都可以執(zhí)行一個(gè)單獨(dú)的任務(wù),并且所有的格子可以同時(shí)執(zhí)行計(jì)算任務(wù),這就是GPU加速的來源。那么剛才所提到的棋盤,每一列都認(rèn)為是一個(gè)線程,并有自己的線程編號(hào);每一行都是一個(gè)塊,有自己的塊編號(hào)。我們可以通過一些簡(jiǎn)單的程序來理解這其中的邏輯:

用GPU打印線程編號(hào)

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): print (’threadIdx:’, cuda.threadIdx.x)if __name__ == ’__main__’: gpu[2,4]()

threadIdx: 0threadIdx: 1threadIdx: 2threadIdx: 3threadIdx: 0threadIdx: 1threadIdx: 2threadIdx: 3用GPU打印塊編號(hào)

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): print (’blockIdx:’, cuda.blockIdx.x)if __name__ == ’__main__’: gpu[2,4]()

blockIdx: 0blockIdx: 0blockIdx: 0blockIdx: 0blockIdx: 1blockIdx: 1blockIdx: 1blockIdx: 1用GPU打印塊的維度

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): print (’blockDim:’, cuda.blockDim.x)if __name__ == ’__main__’: gpu[2,4]()

blockDim: 4blockDim: 4blockDim: 4blockDim: 4blockDim: 4blockDim: 4blockDim: 4blockDim: 4用GPU打印線程的維度

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): print (’gridDim:’, cuda.gridDim.x)if __name__ == ’__main__’: gpu[2,4]()

gridDim: 2gridDim: 2gridDim: 2gridDim: 2gridDim: 2gridDim: 2gridDim: 2gridDim: 2總結(jié)

我們可以用如下的一張圖來總結(jié)剛才提到的GPU網(wǎng)格的概念,在上面的測(cè)試案例中,我們?cè)贕PU上劃分一塊2*4大小的陣列用于我們自己的計(jì)算,每一行都是一個(gè)塊,每一列都是一個(gè)線程,所有的網(wǎng)格是同時(shí)執(zhí)行計(jì)算的內(nèi)容的(如果沒有邏輯上的依賴的話)。

Python實(shí)現(xiàn)GPU加速的基本操作

GPU所支持的最大并行度

我們可以用幾個(gè)簡(jiǎn)單的程序來測(cè)試一下GPU的并行度,因?yàn)槊恳粋€(gè)GPU上的網(wǎng)格都可以獨(dú)立的執(zhí)行一個(gè)任務(wù),因此我們認(rèn)為可以分配多少個(gè)網(wǎng)格,就有多大的并行度。本機(jī)的最大并行應(yīng)該是在(2^40),因此假設(shè)我們給GPU分配(2^50)大小的網(wǎng)格,程序就會(huì)報(bào)錯(cuò):

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): passif __name__ == ’__main__’: gpu[2**50,1]() print (’Running Success!’)

運(yùn)行結(jié)果如下:

Traceback (most recent call last):File 'numba_cuda_test.py', line 10, in <module>gpu[2**50,1]()File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/compiler.py', line 822, in __call__self.stream, self.sharedmem)File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/compiler.py', line 966, in callkernel.launch(args, griddim, blockdim, stream, sharedmem)File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/compiler.py', line 699, in launchcooperative=self.cooperative)File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/cudadrv/driver.py', line 2100, in launch_kernelNone)File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/cudadrv/driver.py', line 300, in safe_cuda_api_callself._check_error(fname, retcode)File '/home/dechin/.local/lib/python3.7/site-packages/numba/cuda/cudadrv/driver.py', line 335, in _check_errorraise CudaAPIError(retcode, msg)numba.cuda.cudadrv.driver.CudaAPIError: [1] Call to cuLaunchKernel results in CUDA_ERROR_INVALID_VALUE

而如果我們分配一個(gè)額定大小之內(nèi)的網(wǎng)格,程序就可以正常的運(yùn)行:

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): passif __name__ == ’__main__’: gpu[2**30,1]() print (’Running Success!’)

這里加了一個(gè)打印輸出:

Running Success!

需要注意的是,兩個(gè)維度上的可分配大小是不一致的,比如本機(jī)的上限是分配230*210大小的空間用于計(jì)算:

# numba_cuda_test.pyfrom numba import cuda@cuda.jitdef gpu(): passif __name__ == ’__main__’: gpu[2**30,2**10]() print (’Running Success!’)

同樣的,只要在允許的范圍內(nèi)都是可以執(zhí)行成功的:

Running Success!

如果在本機(jī)上有多塊GPU的話,還可以通過select_device的指令來選擇執(zhí)行指令的GPU編號(hào):

# numba_cuda_test.pyfrom numba import cudacuda.select_device(1)import time@cuda.jitdef gpu(): passif __name__ == ’__main__’: gpu[2**30,2**10]() print (’Running Success!’)

如果兩塊GPU的可分配空間一致的話,就可以運(yùn)行成功:

Running Success!

GPU的加速效果

前面我們經(jīng)常提到一個(gè)詞叫GPU加速,GPU之所以能夠?qū)崿F(xiàn)加速的效果,正源自于GPU本身的高度并行性。這里我們直接用一個(gè)數(shù)組求和的案例來說明GPU的加速效果,這個(gè)案例需要得到的結(jié)果是(b_j=a_j+b_j),將求和后的值賦值在其中的一個(gè)輸入數(shù)組之上,以節(jié)省一些內(nèi)存空間。當(dāng)然,如果這個(gè)數(shù)組還有其他的用途的話,是不能這樣操作的。具體代碼如下:

# gpu_add.pyfrom numba import cudacuda.select_device(1)import numpy as npimport time@cuda.jitdef gpu(a,b,DATA_LENGHTH): idx = cuda.threadIdx.x + cuda.blockIdx.x * cuda.blockDim.x if idx < DATA_LENGHTH:b[idx] += a[idx]if __name__ == ’__main__’: np.random.seed(1) DATA_EXP_LENGTH = 20 DATA_DIMENSION = 2**DATA_EXP_LENGTH np_time = 0.0 nb_time = 0.0 for i in range(100):a = np.random.randn(DATA_DIMENSION).astype(np.float32)b = np.random.randn(DATA_DIMENSION).astype(np.float32)a_cuda = cuda.to_device(a)b_cuda = cuda.to_device(b)time0 = time.time()gpu[DATA_DIMENSION,4](a_cuda,b_cuda,DATA_DIMENSION)time1 = time.time()c = b_cuda.copy_to_host()time2 = time.time()d = np.add(a,b)time3 = time.time()if i == 0: print (’The error between numba and numpy is: ’, sum(c-d)) continuenp_time += time3 - time2nb_time += time1 - time0 print (’The time cost of numba is: {}s’.format(nb_time)) print (’The time cost of numpy is: {}s’.format(np_time))

需要注意的是,基于Numba實(shí)現(xiàn)的Python的GPU加速程序,采用的jit即時(shí)編譯的模式,也就是說,在運(yùn)行調(diào)用到相關(guān)函數(shù)時(shí),才會(huì)對(duì)其進(jìn)行編譯優(yōu)化。換句話說,第一次執(zhí)行這一條指令的時(shí)候,事實(shí)上達(dá)不到加速的效果,因?yàn)檫@個(gè)運(yùn)行的時(shí)間包含了較長(zhǎng)的一段編譯時(shí)間。但是從第二次運(yùn)行調(diào)用開始,就不需要重新編譯,這時(shí)候GPU加速的效果就體現(xiàn)出來了,運(yùn)行結(jié)果如下:

$ python3 gpu_add.py The error between numba and numpy is: 0.0The time cost of numba is: 0.018711328506469727sThe time cost of numpy is: 0.09502553939819336s

可以看到,即使是相比于Python中優(yōu)化程度十分強(qiáng)大的的Numpy實(shí)現(xiàn),我們自己寫的GPU加速的程序也能夠達(dá)到5倍的加速效果(在前面一篇博客中,針對(duì)于特殊計(jì)算場(chǎng)景,加速效果可達(dá)1000倍以上),而且可定制化程度非常之高。

總結(jié)概要

本文針對(duì)于Python中使用Numba的GPU加速程序的一些基本概念和實(shí)現(xiàn)的方法,比如GPU中的線程和模塊的概念,以及給出了一個(gè)矢量加法的代碼案例,進(jìn)一步說明了GPU加速的效果。需要注意的是,由于Python中的Numba實(shí)現(xiàn)是一種即時(shí)編譯的技術(shù),因此第一次運(yùn)算時(shí)的時(shí)間會(huì)明顯較長(zhǎng),所以我們一般說GPU加速是指從第二步開始的運(yùn)行時(shí)間。對(duì)于一些工業(yè)和學(xué)界常見的場(chǎng)景,比如分子動(dòng)力學(xué)模擬中的系統(tǒng)演化,或者是深度學(xué)習(xí)與量子計(jì)算中的參數(shù)優(yōu)化,都是相同維度參數(shù)多步運(yùn)算的一個(gè)過程,非常適合使用即時(shí)編譯的技術(shù),配合以GPU高度并行化的加速效果,能夠在實(shí)際工業(yè)和學(xué)術(shù)界的各種場(chǎng)景下發(fā)揮巨大的作用。

到此這篇關(guān)于Python實(shí)現(xiàn)GPU加速的基本操作的文章就介紹到這了,更多相關(guān)Python GPU加速內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
精品视频高潮| 日本精品在线中文字幕| 精品三级在线观看视频| 国产欧美69| 久久永久免费| 蜜桃视频在线网站| 亚洲欧美日韩视频二区| 夜夜嗨av一区二区三区网站四季av| 欧美成人久久| 最新国产精品久久久| 日本va欧美va瓶| 麻豆久久久久久| 日韩欧美视频专区| 五月天综合网站| 7777精品| 国产精品午夜一区二区三区| 国产精品99久久精品| 99精品在线免费在线观看| 婷婷成人综合| 日本综合精品一区| 黄色在线网站噜噜噜| 欧美特黄视频| 欧美精品第一区| 91久久中文| 青青国产精品| 日本久久精品| 亚洲色图国产| 日韩av首页| 国产精品香蕉| 日韩午夜av| 麻豆中文一区二区| 首页欧美精品中文字幕| 精品中文在线| 亚洲图片久久| 久久久久中文| 国产成人调教视频在线观看| 欧美天堂亚洲电影院在线观看| 老司机精品视频网| 日韩av成人高清| 国产亚洲精品久久久久婷婷瑜伽| 国产精区一区二区| 亚洲精品福利| 日韩影院在线观看| 黄色av日韩| 久久视频精品| 国产一区二区三区不卡av| 日韩av二区在线播放| 亚洲va久久| 99香蕉国产精品偷在线观看| 欧洲一级精品| 精品国产欧美日韩一区二区三区| 日本在线视频一区二区| 久久国产精品99国产| 在线一区视频| 男人的天堂久久精品| 老司机精品久久| 蜜桃av一区二区在线观看| 在线国产一区二区| 亚洲女同中文字幕| 蜜桃视频在线观看一区| 日韩免费精品| 国产亚洲欧美日韩精品一区二区三区 | 日本va欧美va瓶| 亚洲精品欧洲| 欧美日韩中出| 精品国产亚洲一区二区在线观看| 精品久久中文| 欧美精品一区二区久久| 亚洲精品国产偷自在线观看| 精品日韩毛片| 亚洲+小说+欧美+激情+另类| 97久久亚洲| 九九99久久精品在免费线bt| 国产在线观看91一区二区三区 | 欧美激情99| 欧美黄色网页| 免费一区二区视频| 欧美日韩一区二区三区四区在线观看| 国产精品网在线观看| 日韩福利一区| 在线免费观看亚洲| 国内精品伊人| 亚洲a级精品| 欧美天堂视频| 日本在线一区二区三区| 国产福利片在线观看| 久久xxxx精品视频| 鲁大师精品99久久久| 91精品国产成人观看| 少妇高潮一区二区三区99| 超碰在线99| 亚洲精品人人| 婷婷成人在线| 久久字幕精品一区| 亚洲欧美日韩国产一区二区| 国产精品99视频| 国产日韩一区二区三免费高清| 99精品综合| 国产精品www994| 久久亚洲电影| 日韩精品一区二区三区免费观看| 欧美亚洲二区| 亚洲日本在线观看视频| 久久69成人| 亚洲精品看片| 国产精品外国| 亚洲性视频h| 精品久久久网| 国产日韩欧美一区在线| 蜜桃久久av一区| 午夜精品一区二区三区国产| 日韩欧美一区免费| 欧美激情另类| 成人亚洲精品| 国产精品精品国产一区二区| 国产精品99久久久久久董美香| 在线免费观看亚洲| 亚洲午夜久久| 不卡视频在线| 国产99久久| 亚洲黄页一区| 免费观看日韩电影| 亚洲影院天堂中文av色| 热久久久久久久| 亚洲一二三区视频| 亚洲精品福利| 欧美日韩99| 精品欧美日韩精品| 最新中文字幕在线播放| 久久久久久色 | 91av一区| 久久精品国产网站| sm久久捆绑调教精品一区| 麻豆成人在线观看| 亚洲www免费| 99视频精品| 视频国产精品| 精品精品99| 99成人超碰| 亚洲激情国产| 欧美欧美黄在线二区| 国产精品综合| 中文字幕在线高清| 国产亚洲精品久久久久婷婷瑜伽| 蜜桃一区二区三区在线观看| 国产精品4hu.www| 国产91精品对白在线播放| 久久av在线| 精品视频黄色| 蜜桃av一区二区| 高清av一区| 蜜桃免费网站一区二区三区 | 亚洲激情偷拍| 欧美亚洲网站| 欧美日韩激情| 久久久久久婷| 日本中文字幕视频一区| 久久久久美女| 久久中文字幕导航| 亚洲精品乱码日韩| 久久久久中文| 美女久久久久久| 日韩欧美三区| 亚洲综合三区| 久久中文字幕二区| 国产一区二区三区不卡视频网站| 影音国产精品| 国产精品麻豆久久| 日韩不卡一区二区| 日韩视频一区| 久久国产日韩| 水蜜桃精品av一区二区| 欧美日韩xxxx| 亚洲尤物av| 国产亚洲亚洲| 久久精品国产大片免费观看| 丰满少妇一区| 麻豆一区二区三| 国产精品theporn| 久久狠狠亚洲综合| 日本不卡视频在线观看| 欧美专区18| 一区二区国产在线| 欧美不卡高清| 免费日韩一区二区| 亚洲激情黄色| 日韩中文字幕区一区有砖一区| 在线亚洲一区| 视频国产精品| 国产精品一二| 精品国产午夜| 九色porny丨国产首页在线| sm久久捆绑调教精品一区| 成人综合一区| 日韩精品影视| 亚洲欧美日韩精品一区二区| 蜜臀av性久久久久蜜臀aⅴ流畅 | 精精国产xxxx视频在线野外| 日韩中文字幕高清在线观看| 日韩一区欧美|