日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

瀏覽:56日期:2022-07-31 16:46:55

wordcloud是Python擴(kuò)展庫(kù)中一種將詞語(yǔ)用圖片表達(dá)出來(lái)的一種形式,通過(guò)詞云生成的圖片,我們可以更加直觀的看出某篇文章的故事梗概。

首先貼出一張?jiān)~云圖(以哈利波特小說(shuō)為例):

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

在生成詞云圖之前,首先要做一些準(zhǔn)備工作

1.安裝結(jié)巴分詞庫(kù)

pip install jieba

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

Python中的分詞模塊有很多,他們的功能也都是大同小異,我們安裝的結(jié)巴分詞 是當(dāng)前使用的最多的類(lèi)型。

下面我來(lái)簡(jiǎn)單介紹一下結(jié)巴分詞的用法

結(jié)巴分詞的分詞模式分為三種:

(1)全模式:把句子中所有的可以成詞的詞語(yǔ)都掃描出來(lái), 速度快,但是不能解決歧義問(wèn)題

(2)精確模式:將句子最精確地切開(kāi),適合文本分析

(3)搜索引擎模式:在精確模式的基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分,提高召回率,適合用于搜索引擎分詞

下面用一個(gè)簡(jiǎn)單的例子來(lái)看一下三種模式的分詞區(qū)別:

import jieba # 全模式:把句子中所有的可以成詞的詞語(yǔ)都掃描出來(lái), 速度快,但是不能解決歧義問(wèn)題 text = '哈利波特是一常優(yōu)秀的文學(xué)作品' seg_list = jieba.cut(text, cut_all=True) print(u'[全模式]: ', '/ '.join(seg_list)) # 精確模式:將句子最精確地切開(kāi),適合文本分析 seg_list = jieba.cut(text, cut_all=False) print(u'[精確模式]: ', '/ '.join(seg_list)) # 默認(rèn)是精確模式 seg_list = jieba.cut(text) print(u'[默認(rèn)模式]: ', '/ '.join(seg_list)) # 搜索引擎模式:在精確模式的基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分,提高召回率,適合用于搜索引擎分詞seg_list = jieba.cut_for_search(text)print(u'[搜索引擎模式]: ', '/ '.join(seg_list))

下面是對(duì)這句話的分詞方式:

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

通過(guò)這三種分詞模式可以看出,這些分詞模式并沒(méi)有很好的劃分出“哈利波特”這個(gè)專(zhuān)有名詞,這是因?yàn)樵诮Y(jié)巴分詞的字典中并沒(méi)有記錄這個(gè)名詞,所以需要我們手動(dòng)添加自定義字典

添加自定義字典:找一個(gè)方便引用的位置 (下圖的路徑是我安裝的位置),新建文本文檔(后綴名為.txt),將想添加的詞輸入進(jìn)去(注意輸入格式),保存并退出

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

在上面的代碼中加入自定義字典的路徑,再點(diǎn)擊運(yùn)行

jieba.load_userdict('/home/jmhao/anaconda3/lib/python3.7/site-packages/jieba/mydict.txt')

分詞結(jié)果,可以看出“哈利波特”這個(gè)詞已經(jīng)被識(shí)別出來(lái)了

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

結(jié)巴分詞還有另一個(gè)禁用詞的輸出結(jié)果

stopwords = {}.fromkeys([’優(yōu)秀’, ’文學(xué)作品’]) #添加禁用詞之后 seg_list = jieba.cut(text) final = ’’ for seg in seg_list: if seg not in stopwords: final += seg seg_list_new = jieba.cut(final) print(u'[切割之后]: ', '/ '.join(seg_list_new))

可以看到輸出結(jié)果中并沒(méi)有“優(yōu)秀”和“文學(xué)作品”兩個(gè)詞

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

結(jié)巴分詞還有很多比較復(fù)雜的操作,具體的可以去官網(wǎng)查看,我就不再過(guò)多的贅述了

下面我們正式開(kāi)始詞云的制作

首先下載模塊,這里我所使用的環(huán)境是Anaconda,由于Anaconda中包含很多常用的擴(kuò)展包,所以這里只需要下載wordcloud。若使用的環(huán)境不是Anaconda,則另需安裝numpy和PIL模塊

pip install wordcloud

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

然后我們需要找一篇文章并使用結(jié)巴分詞將文章分成詞語(yǔ)的形式

# 分詞模塊 def cut(text): # 選擇分詞模式 word_list = jieba.cut(text,cut_all= True) # 分詞后在單獨(dú)個(gè)體之間加上空格 result = ' '.join(word_list) # 返回分詞結(jié)果 return result

這里我在當(dāng)前文件夾下創(chuàng)建了一個(gè)文本文檔“xiaoshuo.txt”,并復(fù)制了一章的小說(shuō)作為詞云的主體文字

使用代碼控制,打開(kāi)并讀取小說(shuō)的內(nèi)容

#導(dǎo)入文本文件,進(jìn)行分詞,制作詞云 with open('xiaoshuo.txt') as fp: text = fp.read() # 將讀取的中文文檔進(jìn)行分詞 text = cut(text)

在網(wǎng)上找到一張白色背景的圖片下載到當(dāng)前文件夾,作為詞云的背景圖(若不指定圖片,則默認(rèn)生成矩形詞云)

#設(shè)置詞云形狀,若設(shè)置了詞云的形狀,生成的詞云與圖片保持一致,后面設(shè)置的寬度和高度將默認(rèn)無(wú)效 mask = np.array(image.open('monkey.jpeg'))

接下來(lái)可以根據(jù)喜好來(lái)定義詞云的顏色、輪廓等參數(shù) 下面為常用的參數(shù)設(shè)置方法

font_path : '字體路徑' 詞云的字體樣式,若要輸出中文,則跟隨中文的字體 width = n 畫(huà)布寬度,默認(rèn)為400像素 height = n 畫(huà)布高度,默認(rèn)為400像素 scale = n 按比例放大或縮小畫(huà)布 min_font_size = n 設(shè)置最小的字體大小 max_font_size = n 設(shè)置最大的字體大小 stopwords = ’words’ 設(shè)置要屏蔽的詞語(yǔ) background_color = ’’color 設(shè)置背景板顏色 relative_scaling = n 設(shè)置字體大小與詞頻的關(guān)聯(lián)性 contour_width = n 設(shè)置輪廓寬度 contour_color = ’color’ 設(shè)置輪廓顏色

完整代碼

#導(dǎo)入詞云庫(kù) from wordcloud import WordCloud #導(dǎo)入圖像處理庫(kù) import PIL.Image as image #導(dǎo)入數(shù)據(jù)處理庫(kù) import numpy as np #導(dǎo)入結(jié)巴分詞庫(kù) import jieba # 分詞模塊 def cut(text): # 選擇分詞模式 word_list = jieba.cut(text,cut_all= True) # 分詞后在單獨(dú)個(gè)體之間加上空格 result = ' '.join(word_list) return result #導(dǎo)入文本文件,進(jìn)行分詞,制作詞云 with open('xiaoshuo.txt') as fp: text = fp.read() # 將讀取的中文文檔進(jìn)行分詞 text = cut(text) #設(shè)置詞云形狀 mask = np.array(image.open('monkey.jpeg')) #自定義詞云 wordcloud = WordCloud( # 遮罩層,除白色背景外,其余圖層全部繪制(之前設(shè)置的寬高無(wú)效) mask=mask, #默認(rèn)黑色背景,更改為白色 background_color=’#FFFFFF’, #按照比例擴(kuò)大或縮小畫(huà)布 scale=, # 若想生成中文字體,需添加中文字體路徑 font_path='/usr/share/fonts/bb5828/逐浪雅宋體.otf' ).generate(text) #返回對(duì)象 image_produce = wordcloud.to_image() #保存圖片 wordcloud.to_file('new_wordcloud.jpg') #顯示圖像 image_produce.show()

注:若想要生成圖片樣式的詞云圖,找到的圖片背景必須為白色,或者使用Photoshop摳圖替換成白色背景,否則生成的詞云為矩形

我的詞云原圖:

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

生成的詞云圖:

Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例

到此這篇關(guān)于Python實(shí)現(xiàn)Wordcloud生成詞云圖的示例的文章就介紹到這了,更多相關(guān)Python Wordcloud生成詞云圖內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: python
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产aa精品| 国产国产精品| 国产一区二区三区不卡视频网站 | 蜜桃伊人久久| 日韩精品免费一区二区在线观看 | 欧美日韩四区| 欧美成人精品| 老色鬼久久亚洲一区二区| 免费观看在线综合| 欧美久久精品| 亚洲一区二区免费看| 激情综合自拍| 男女精品网站| 国产日韩欧美三区| 日本精品不卡| 日韩在线观看一区二区三区| 日本免费在线视频不卡一不卡二| 性一交一乱一区二区洋洋av| 首页国产欧美日韩丝袜| 国产精品xxxav免费视频| 91一区二区三区四区| 国产日韩综合| 国产精品免费精品自在线观看| 夜夜嗨网站十八久久| 日本a级不卡| 亚洲欧美日韩专区| 国产91在线精品| 精品一区二区三区四区五区| 久久精品123| 日韩欧美高清一区二区三区| 蜜桃视频免费观看一区| 麻豆精品在线播放| 成人台湾亚洲精品一区二区 | 免费av一区| 亚洲欧美日韩在线观看a三区| 91成人精品在线| 麻豆理论在线观看| 亚洲97av| 亚洲欧美一区在线| 日韩手机在线| 蜜桃av.网站在线观看| 免费在线小视频| 国产精东传媒成人av电影| 999久久久91| 99精品99| 美女性感视频久久| 婷婷综合电影| 麻豆mv在线观看| 亚洲精品动态| 99tv成人| 99精品视频在线观看免费播放| 成人日韩在线观看| 国产极品久久久久久久久波多结野 | 久久精品一区二区国产| 日韩综合在线| 麻豆国产欧美日韩综合精品二区| 欧美国产极品| 日韩不卡一二三区| 亚洲一区二区成人| 亚洲欧洲美洲av| 日韩一区欧美| 97久久超碰| 欧美日韩xxxx| 国产精品久久乐| 欧美交a欧美精品喷水| 97se亚洲| 久久午夜精品| 亚洲精品四区| 夜夜嗨一区二区| 丝袜美腿高跟呻吟高潮一区| 蜜臀av性久久久久蜜臀aⅴ四虎| 蜜臀va亚洲va欧美va天堂| 日韩和欧美的一区| 狂野欧美性猛交xxxx| 久久久人人人| 亚洲区第一页| 欧美国产极品| 欧美精品羞羞答答| 日韩一二三区在线观看| 另类欧美日韩国产在线| 麻豆精品在线观看| 蜜臀久久99精品久久一区二区| 老牛影视一区二区三区| 麻豆91在线播放| 精品一区在线| 久久精品 人人爱| 久久精品卡一| 欧美日韩亚洲一区二区三区在线| 国产欧美一区二区三区精品酒店| 亚洲视频播放| yellow在线观看网址| 中文在线日韩| 久久伦理在线| 国产精品毛片aⅴ一区二区三区| a日韩av网址| 四虎精品一区二区免费| 亚洲婷婷免费| 成人台湾亚洲精品一区二区| 蜜芽一区二区三区| 中文另类视频| 精品视频在线观看网站| 亚洲精品黄色| 欧美日韩国产高清电影| 国产成人精品一区二区三区视频 | 亚洲3区在线| 亚洲爱爱视频| 国产中文字幕一区二区三区| 91亚洲无吗| 亚州欧美在线| 亚洲激情国产| 国产视频欧美| 中文字幕高清在线播放| 国产精品极品在线观看| 亚洲三级观看| 日本欧美在线看| 亚洲激情中文| 欧美+日本+国产+在线a∨观看| 国产成人免费精品| 国产精品激情电影| 亚洲男人在线| 日韩激情中文字幕| 婷婷综合电影| 日本成人在线视频网站| 亚洲免费成人av在线| 久久av一区| 亚洲久久在线| 日韩精品免费视频人成| 日本精品久久| 国产精品欧美日韩一区| 国产亚洲第一伦理第一区| 91精品啪在线观看国产爱臀| 亚洲精品福利| 国产美女精品视频免费播放软件| 日韩精品免费观看视频| 欧美伊人久久| 久久中文字幕一区二区三区| 国产伊人久久| 中文在线а√天堂| 久久精品观看| 99国产精品私拍| 日韩在线观看一区二区三区| 欧美三区不卡| 粉嫩av一区二区三区四区五区 | 国产精品久久久久久久久免费高清| 精品国产中文字幕第一页| 国产精品mv在线观看| 亚洲精品大全| 久久这里只有精品一区二区| 日韩在线第七页| 精品日韩视频| 日本欧洲一区二区| 九九99久久精品在免费线bt| 在线一区免费观看| 日韩精品免费视频一区二区三区| 国产欧美日韩精品一区二区三区| 色综合狠狠操| 综合激情五月婷婷| 亚洲综合电影| 久久精品xxxxx| 影院欧美亚洲| 人人草在线视频| 69堂精品视频在线播放| 激情偷拍久久| 国产一区二区三区四区大秀| 亚洲乱亚洲高清| 狠狠操综合网| 日韩毛片视频| 国产亚洲精品精品国产亚洲综合| 一本一本久久| 精品日本视频| 国产精品日本一区二区不卡视频 | 欧美好骚综合网| 久久久久久久久丰满| 国产精品成人一区二区网站软件| 日韩中文欧美在线| 亚洲二区在线| 久久精品卡一| 日韩欧美少妇| 欧美一级鲁丝片| 蜜臀国产一区| www.51av欧美视频| 精品亚洲成人| 欧美日韩一视频区二区| 免费成人性网站| 亚洲影视一区| 日本不卡视频在线| 先锋亚洲精品| 亚洲尤物av| 久久国产欧美日韩精品| 日本va欧美va欧美va精品| 7777精品| 麻豆传媒一区二区三区| 国产精品久av福利在线观看| 久久av影院| 久久影视三级福利片| 老牛国内精品亚洲成av人片| 精品国产美女a久久9999| 精品视频一区二区三区四区五区| 国产一区二区视频在线看| 日韩在线观看中文字幕|