運(yùn)行python程序時(shí)出現(xiàn)“應(yīng)用程序發(fā)生異常”的內(nèi)存錯(cuò)誤?
問(wèn)題描述
我寫了一個(gè)70行左右的python小程序,用來(lái)計(jì)算文檔的相似性。材料是88篇論文文檔,用到了gensim包。程序的流程是預(yù)處理文檔(刪去不必要的符號(hào),分詞等),計(jì)算文檔的tfidf值,建立88篇論文的tfidf模型以及模型索引。到這里程序運(yùn)行都是正常的,但是在使用索引的時(shí)候,報(bào)錯(cuò):
請(qǐng)問(wèn)這是什么原因引起的呢?謝謝~
以下是部分運(yùn)行沒有問(wèn)題的源代碼:
#分詞:texts = [[word for word in document.split()]for document in documents]#利用所有文檔,創(chuàng)建詞典dictionary = corpora.Dictionary(texts)#創(chuàng)建語(yǔ)料corpus = [dictionary.doc2bow(text) for text in texts]#利用這些語(yǔ)料,創(chuàng)建tfidf模型tfidf_model = models.TfidfModel(corpus)#計(jì)算每個(gè)文檔的tfidftfidfs = tfidf_model[corpus]#創(chuàng)建tfidf的索引index = similarities.SparseMatrixSimilarity(tfidfs,num_features=88075)
運(yùn)行這個(gè)代碼時(shí)出現(xiàn)了問(wèn)題:
#創(chuàng)建目標(biāo)文檔的語(yǔ)料content = ’A student of music needs as long and as arduous a training to become a performer as a medical student needs to become a doctor’content = content.lower().split()test = dictionary.doc2bow(content)#計(jì)算目標(biāo)文檔的tfidftest_tfidf = tfidf_model[test]sims = index[test_tfidf]#**就是這一句出現(xiàn)了問(wèn)題!**
問(wèn)題解答
回答1:你的python版本?當(dāng)前 gensim的版本?是否和官網(wǎng)測(cè)試過(guò)的穩(wěn)定版一致?還有,建議使用類Unix系統(tǒng),gensim基于 NumPy 和 Scipy,這兩者在win上都不好安裝吧,安裝好了也不見得不會(huì)出問(wèn)題
回答2:這種錯(cuò)誤也有可能是Windows操作系統(tǒng)的鍋,你把代碼復(fù)制到Google一下會(huì)發(fā)現(xiàn)很多解決方案,比如這個(gè):
How to fix 0xc0000417 Error?回答3:http://www.wiki-errors.com/do... 下載安裝即可,退百度保平安。
回答4:操作系統(tǒng)用的盜版?換成Linux吧。
相關(guān)文章:
1. javascript - JS new Date() 保存到 mongodb 中會(huì)早8個(gè)小時(shí),我們這里是東八區(qū),mongodb 保存的是格林尼治時(shí)間2. android百度地圖定位問(wèn)題3. java - 判斷數(shù)據(jù)在數(shù)據(jù)庫(kù)中是否已存在.4. python - django models 為生成的html元素添加樣式。5. javascript - 關(guān)于圣杯布局的一點(diǎn)疑惑6. android - 圖片列表分組之后復(fù)用問(wèn)題7. android - 有數(shù)據(jù)要處理的時(shí)候如何使用rxJava進(jìn)行異步處理數(shù)據(jù)8. nginx bind failed9. 為什么我寫的PHP不行10. css - input間的間距和文字上下居中

網(wǎng)公網(wǎng)安備