日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單文本分類(lèi)

瀏覽:26日期:2022-06-27 10:37:02

深度學(xué)習(xí)無(wú)處不在。在本文中,我們將使用Keras進(jìn)行文本分類(lèi)。

準(zhǔn)備數(shù)據(jù)集

出于演示目的,我們將使用 20個(gè)新聞組 數(shù)據(jù)集。數(shù)據(jù)分為20個(gè)類(lèi)別,我們的工作是預(yù)測(cè)這些類(lèi)別。如下所示:

Python如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單文本分類(lèi)

通常,對(duì)于深度學(xué)習(xí),我們將劃分訓(xùn)練和測(cè)試數(shù)據(jù)。

導(dǎo)入所需的軟件包

Python

import pandas as pdimport numpy as npimport picklefrom keras.preprocessing.text import Tokenizerfrom keras.models import Sequentialfrom keras.layers import Activation, Dense, Dropoutfrom sklearn.preprocessing import LabelBinarizerimport sklearn.datasets as skdsfrom pathlib import Path將數(shù)據(jù)從文件加載到Python變量

Python

# 為了復(fù)現(xiàn)性np.random.seed(1237) label_index = files_train.targetlabel_names = files_train.target_nameslabelled_files = files_train.filenames data_tags = ['filename','category','news']data_list = [] # 讀取文件中的數(shù)據(jù)并將其添加到列表 data = pd.DataFrame.from_records(data_list, columns=data_tags)

我們的數(shù)據(jù)無(wú)法以CSV格式提供。我們有文本數(shù)據(jù)文件,文件存放的目錄是我們的標(biāo)簽或類(lèi)別。

我們將使用scikit-learn load_files方法。這種方法可以提供原始數(shù)據(jù)以及標(biāo)簽和標(biāo)簽索引。

最后我們得到一個(gè)數(shù)據(jù)框,其中包含文件名,類(lèi)別和實(shí)際數(shù)據(jù)。

拆分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試

Python

# 讓我們以80%的數(shù)據(jù)作為訓(xùn)練,剩下的20%作為測(cè)試。train_size = int(len(data) * .8) train_posts = data[’news’][:train_size]train_tags = data[’category’][:train_size]train_files_names = data[’filename’][:train_size] test_posts = data[’news’][train_size:]test_tags = data[’category’][train_size:]test_files_names = data[’filename’][train_size:]標(biāo)記化并準(zhǔn)備詞匯

Python

# 20個(gè)新聞組num_labels = 20vocab_size = 15000batch_size = 100 # 用Vocab Size定義Tokenizertokenizer = Tokenizer(num_words=vocab_size)tokenizer.fit_on_texts(train_posts)

在對(duì)文本進(jìn)行分類(lèi)時(shí),我們首先使用Bag Of Words方法對(duì)文本進(jìn)行預(yù)處理。

預(yù)處理輸出標(biāo)簽/類(lèi)

在將文本轉(zhuǎn)換為數(shù)字向量后,我們還需要確保標(biāo)簽以神經(jīng)網(wǎng)絡(luò)模型接受的數(shù)字格式表示。

建立Keras模型并擬合

PowerShell

model = Sequential()

它為輸入數(shù)據(jù)的維度以及構(gòu)成模型的圖層類(lèi)型提供了簡(jiǎn)單的配置。

這是擬合度和測(cè)試準(zhǔn)確性的代碼段

100/8145 [..............................] - ETA: 31s - loss: 1.0746e-04 - acc: 1.0000200/8145 [..............................] - ETA: 31s - loss: 0.0186 - acc: 0.9950 300/8145 [>.............................] - ETA: 35s - loss: 0.0125 - acc: 0.9967400/8145 [>.............................] - ETA: 32s - loss: 0.0094 - acc: 0.9975500/8145 [>.............................] - ETA: 30s - loss: 0.0153 - acc: 0.9960...7900/8145 [============================>.] - ETA: 0s - loss: 0.1256 - acc: 0.98548000/8145 [============================>.] - ETA: 0s - loss: 0.1261 - acc: 0.98558100/8145 [============================>.] - ETA: 0s - loss: 0.1285 - acc: 0.98548145/8145 [==============================] - 29s 4ms/step - loss: 0.1293 - acc: 0.9854 - val_loss: 1.0597 - val_acc: 0.8742 Test accuracy: 0.8767123321648251評(píng)估模型

Python

for i in range(10): prediction = model.predict(np.array([x_test[i]])) predicted_label = text_labels[np.argmax(prediction[0])] print(test_files_names.iloc[i]) print(’Actual label:’ + test_tags.iloc[i]) print('Predicted label: ' + predicted_label)

在Fit方法訓(xùn)練了我們的數(shù)據(jù)集之后,我們將如上所述評(píng)估模型。

混淆矩陣

混淆矩陣是可視化模型準(zhǔn)確性的最佳方法之一。

Python如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單文本分類(lèi)

保存模型

通常,深度學(xué)習(xí)的用例就像在不同的會(huì)話(huà)中進(jìn)行數(shù)據(jù)訓(xùn)練,而使用訓(xùn)練后的模型進(jìn)行預(yù)測(cè)一樣。

# 創(chuàng)建一個(gè)HDF5文件’my_model.h5’model.model.save(’my_model.h5’) # 保存令牌生成器,即詞匯表with open(’tokenizer.pickle’, ’wb’) as handle: pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)

Keras沒(méi)有任何實(shí)用程序方法可將Tokenizer與模型一起保存。我們必須單獨(dú)序列化它。

加載Keras模型

Python

預(yù)測(cè)環(huán)境還需要注意標(biāo)簽。

encoder.classes_ #標(biāo)簽二值化預(yù)測(cè)

如前所述,我們已經(jīng)預(yù)留了一些文件進(jìn)行實(shí)際測(cè)試。

Python

labels = np.array([’alt.atheism’, ’comp.graphics’, ’comp.os.ms-windows.misc’,’comp.sys.ibm.pc.hardware’, ’comp.sys.mac.hardware’, ’comp.windows.x’,’misc.forsale’, ’rec.autos’, ’rec.motorcycles’, ’rec.sport.baseball’,’rec.sport.hockey’, ’sci.crypt’, ’sci.electronics’, ’sci.med’, ’sci.space’,’soc.religion.christian’, ’talk.politics.guns’, ’talk.politics.mideast’,’talk.politics.misc’, ’talk.religion.misc’]) ...for x_t in x_tokenized: prediction = model.predict(np.array([x_t])) predicted_label = labels[np.argmax(prediction[0])] print('File ->', test_files[i], 'Predicted label: ' + predicted_label) i += 1輸出

File -> C:DL20news-bydate20news-bydate-testcomp.graphics38758 Predicted label: comp.graphicsFile -> C:DL20news-bydate20news-bydate-testmisc.forsale76115 Predicted label: misc.forsaleFile -> C:DL20news-bydate20news-bydate-testsoc.religion.christian21329 Predicted label: soc.religion.christian

我們知道目錄名是文件的真實(shí)標(biāo)簽,因此上述預(yù)測(cè)是準(zhǔn)確的。

結(jié)論

在本文中,我們使用Keras python庫(kù)構(gòu)建了一個(gè)簡(jiǎn)單而強(qiáng)大的神經(jīng)網(wǎng)絡(luò)。

以上就是Python如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單文本分類(lèi)的詳細(xì)內(nèi)容,更多關(guān)于python 神經(jīng)網(wǎng)絡(luò)進(jìn)行文本分類(lèi)的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产成人精品免费视| 欧美一级久久| 精品国产欧美日韩| 欧美精品97| 国产精品亲子伦av一区二区三区| 一本综合精品| 国产日韩欧美在线播放不卡| 日韩国产在线一| 国产高清精品二区| 97在线精品| 欧美.日韩.国产.一区.二区 | 国产精品毛片视频| 欧美激情91| 国产精品毛片一区二区在线看| 欧美丰满日韩| jiujiure精品视频播放| 蜜桃视频一区二区三区在线观看| 免费在线欧美视频| 久久不卡日韩美女| 欧美日韩一区二区综合| 99视频精品| 欧美日韩99| 久久婷婷丁香| 亚洲免费网址| 麻豆91小视频| 999在线观看精品免费不卡网站| 亚洲精品黄色| 亚洲黄色网址| 日本91福利区| 亚洲欧美综合| 国产美女精品视频免费播放软件| 老牛影视精品| 亚洲精品四区| 91看片一区| 国产精品久久久久毛片大屁完整版| 国产精品久久久久蜜臀 | 黄色不卡一区| 欧美黑人做爰爽爽爽| 亚洲欧美日韩国产一区二区| 麻豆视频久久| 亚洲人www| 91精品91| 成人片免费看| 国产精品嫩模av在线| 亚洲在线成人| 久久人人97超碰国产公开结果| 国产麻豆一区| 一区二区不卡| 欧美日韩国产探花| 日韩久久一区二区三区| 日本国产欧美| 美国三级日本三级久久99 | 日韩av中文字幕一区二区三区| 99精品国产一区二区三区| 国产欧美啪啪| 国产欧美69| 91亚洲无吗| 日韩不卡一区二区| 亚州精品视频| 亚洲五月综合| 日韩中文字幕视频网| 亚洲小说欧美另类婷婷| 日韩中文影院| 国模 一区 二区 三区| 久久在线免费| 一本一道久久a久久精品蜜桃| 91精品综合| 黄色av日韩| 99视频精品| 亚洲精品进入| 国产欧美二区| 久久免费精品| 日韩中文首页| 欧美国产91| 亚洲伊人精品酒店| 欧美日韩 国产精品| 中文字幕一区二区三区在线视频| 亚洲青青久久| 精品欠久久久中文字幕加勒比| 精品国产18久久久久久二百| 精品国模一区二区三区| 红桃视频国产一区| 97久久中文字幕| 国产精品毛片久久| 99成人在线| 国产精选一区| 99精品在线免费在线观看| 六月婷婷一区| 精品一区二区三区亚洲| 亚洲91精品| 日本中文字幕视频一区| 国产精品亚洲四区在线观看| av一区在线| 欧美一区不卡| 九九精品调教| 日韩二区在线观看| 亚洲v在线看| 国产欧美自拍| 欧美理论视频| 久久国产精品免费精品3p| 日韩大片在线| 国产亚洲一卡2卡3卡4卡新区| 91精品蜜臀一区二区三区在线| 中文字幕一区二区三区四区久久 | 精品一区91| 亚洲欧美久久久| 中文字幕在线高清| 日韩精彩视频在线观看| 婷婷中文字幕一区| 99久久精品网| 日韩一区电影| 国产传媒在线观看| 久久精品毛片| 精品视频一区二区三区在线观看 | 三上亚洲一区二区| 久久精品国产久精国产| 国产日韩欧美一区| 日韩中文av| 日韩av一二三| 日本91福利区| 国产精品视频一区二区三区| 日韩精品一区二区三区中文字幕| 视频一区二区国产| 樱桃成人精品视频在线播放| 高清av一区| 黄色aa久久| 国产精品大片| 精品久久国产一区| 亚洲ab电影| 亚洲综合专区| 久热re这里精品视频在线6| 国产亚洲综合精品| 欧美日韩精品一区二区视频| 成人精品国产亚洲| 福利片在线一区二区| 国产精品2区| 国产午夜久久av| 美女毛片一区二区三区四区最新中文字幕亚洲| 国产精品试看| 免费日韩av片| 午夜一级久久| 在线综合亚洲| 久久激情av| 日本成人中文字幕| 日韩国产欧美视频| 日韩精品中文字幕吗一区二区| 蜜桃视频欧美| 日韩激情综合| 久久精品一区二区三区中文字幕| 国产免费久久| 精品淫伦v久久水蜜桃| 在线日韩中文| 蜜桃av一区| 91精品国产自产精品男人的天堂| 日韩av一区二区在线影视| 日韩av中文在线观看| 欧美a级一区二区| 精品免费av| 高清不卡亚洲| 国产精品日本| 中文字幕在线高清| 日韩亚洲在线| 日本电影久久久| 精品国产亚洲日本| 亚州av日韩av| 色在线中文字幕| 久久国产88| 你懂的国产精品| 久久国产毛片| 中文在线а√在线8| 国产videos久久| 日韩国产精品久久久久久亚洲| 久久久久久色| 国产精品调教| 国精品产品一区| 久久av综合| 国产精品久久久久久妇女| 国产一区二区三区不卡视频网站| 99热精品久久| 911精品国产| 在线日韩欧美| 四虎国产精品免费观看| 欧美专区一区二区三区| 麻豆精品视频在线观看视频| 激情欧美丁香| 欧洲一区二区三区精品| 91精品视频一区二区| 99国产精品久久久久久久成人热 | 一二三区精品| 99国产一区| 黑人精品一区| 国产精品一区2区3区| 亚洲免费婷婷| 久久视频一区| 激情久久久久久久| 精品网站aaa| 国产精品一区二区av交换| 亚洲欧洲午夜| 日本在线成人| 日韩一区精品字幕|