日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

瀏覽:152日期:2022-07-21 08:53:57

這幾天想統(tǒng)計一下《中國人文社會科學期刊 AMI 綜合評價報告(2018 年):A 刊評價報告》中的期刊,但是只找到了該報告的PDF版,對于表格的編輯不太方便,于是想到用Python將表格轉(zhuǎn)成Excel格式。

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

看過別人寫的博客,發(fā)現(xiàn)Python解析PDF有以下四種方式:

-pdfminer:擅長文字的解析,把表格解析成普通的文本,沒有格式;-pdf2html:把pdf解析成html,但html的標簽并沒有規(guī)律,解析一個表格還可以,多個表格的話不太好提取;-tabula:對于簡單的表格,即單元格中沒有換行的,表頭表尾形式不復雜的,使用比較方便。但是單腦需要Java環(huán)境;-pdfplumber:是一個可以處理pdf格式信息的庫。可以查找關(guān)于每個文本字符、矩陣、和行的詳細信息,也可以對表格進行提取并進行可視化調(diào)試。

本文采用pdfplumber庫讀取PDF中的表格,運行環(huán)境:Python3.5.2,Anaconda4.2.0。首先簡單介紹一下pdfplumber庫:

-pdfplumber.pdf中包含了.metadata和.pages兩個屬性:.metadata是一個包含pdf信息的字典。.pages是一個包含頁面信息的列表。

-pdfplumber.page的類中包含的主要的屬性:

.page_number 頁碼。.width 頁面寬度。.height 頁面高度。.objects/.chars/.lines/.rects 這些屬性中每一個都是一個列表,每個列表都包含一個字典,每個字典用于說明頁面中的對象信息, 包括直線,字符, 方格等位置信息。

-一些常用的方法:

.extract_text() 用來提頁面中的文本,將頁面的所有字符對象整理為的那個字符串。.extract_words() 返回的是所有的單詞及其相關(guān)信息。.extract_tables() 提取頁面的表格。.to_image() 用于可視化調(diào)試時,返回PageImage類的一個實例。

import pdfplumberimport pandas as pdpath = ’test.pdf’pdf = pdfplumber.open(path)i=1#writer=pd.ExcelWriter(’output.xlsx’)df=pd.DataFrame(columns=[’序號’,’刊名’,’主辦單位’,’等級’])sheetname=[’考古文博’,’歷史學’,’馬克思主義理論’,’民族學與文化學’,’文學-外國文學’,’文學-中國文學’,’藝術(shù)學’,’語言學’,’哲學’,’宗教學’,’法學’ ,’管理學’,’環(huán)境科學’,’教育學’,’經(jīng)濟學-財政科學’,’經(jīng)濟學-工業(yè)經(jīng)濟’,’經(jīng)濟學-金融’,’經(jīng)濟學-經(jīng)濟管理’,’經(jīng)濟學-經(jīng)濟綜合’,’經(jīng)濟學-貿(mào)易經(jīng)濟’ ,’經(jīng)濟學-農(nóng)業(yè)經(jīng)濟’,’經(jīng)濟學-世界經(jīng)濟’,’人文地理學’,’社會學’,’體育學’,’統(tǒng)計學’,’圖書館情報與檔案學’,’心理學’,’新聞學與傳播學’ ,’政治學-國際政治’,’政治學-中國政治’,’綜合-高校綜合性學報’,’綜合-綜合性人文社科期刊’] ##由于存在一個表格跨頁的情況,先將所有表格存放在一個DataFrame中,再根據(jù)序號拆分。for page in pdf.pages[17:59]: print (page) # 獲取當前頁面的全部文本信息,包括表格中的文字 # print(page.extract_text()) for table in page.extract_tables(): #print(table) df=df.append(pd.DataFrame(table[1:],columns=table[0]),ignore_index=True)print (df)writer=pd.ExcelWriter(’output3.xlsx’)new_df=pd.DataFrame()j=1index=[]#記錄序號==1的行索引,用于后面的表格拆分for i in range(len(df)): if df.ix[i,0]==’1’: index.append(i) print ('################')index.append(len(df))#print (index)#按行索引將內(nèi)容切片并逐個添加到表中for t in range(len(index)-1): new_df=df.ix[index[t]:index[t+1]-1,:] #print (new_df) new_df.to_excel(writer,sheet_name=sheetname[t],encoding=’gb2312’,index=None)writer.save()pdf.close()print(’finished’)

最終保存為Excel。

python實現(xiàn)PDF中表格轉(zhuǎn)化為Excel的方法

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標簽: python
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产欧美一级| 日本不良网站在线观看| 天堂网在线观看国产精品| 91亚洲国产| 四虎影视精品| 精品一区亚洲| 亚洲欧美日本国产专区一区| 国产精品丝袜xxxxxxx| 免费在线视频一区| 蘑菇福利视频一区播放| 日韩中文字幕1| 日韩在线电影| 国产精品毛片视频| 91欧美国产| 免费欧美一区| 欧美日中文字幕| 亚洲一区观看| 日韩欧美美女在线观看| 国产精品一级| 精品久久电影| 91精品一区二区三区综合| 99亚洲精品| 日韩不卡一二三区| 欧美激情麻豆| 日韩久久精品| 国产精品人人爽人人做我的可爱| 日韩欧美激情| 精品三级av| 在线日韩视频| 日韩国产欧美在线播放| 国产免费av国片精品草莓男男| 麻豆成人av在线| 欧美成人基地 | 国产欧美另类| 日韩av在线播放网址| 国产精品7m凸凹视频分类| 日韩视频精品在线观看| 日韩高清二区| 国产精品精品| 丝袜美腿成人在线| 国产精品自拍区| 久久毛片亚洲| 亚洲欧美日韩一区在线观看| 国产精久久久| 影音先锋国产精品| 91av一区| 成人自拍av| 日韩国产一区二| 日韩理论片av| 色8久久久久| av一区在线| 亚洲综合福利| 亚洲综合在线电影| 日本色综合中文字幕| 久久久久久久久99精品大| 日韩欧美久久| 久久激情中文| 欧美日韩黄网站| 99久久精品费精品国产| 91嫩草精品| 亚洲激情久久| 国产精品久久久久久妇女| 蜜臀av免费一区二区三区| 国产探花在线精品一区二区| 尤物在线精品| 国产成人免费av一区二区午夜| 日韩一区二区久久| 九九99久久精品在免费线bt| 在线 亚洲欧美在线综合一区| 久久av网址| 久久国产精品亚洲77777| 国产福利91精品一区二区| 午夜久久av | 91亚洲无吗| 不卡在线一区二区| 国产一区二区色噜噜| 快she精品国产999| 亚洲精品一区三区三区在线观看| 国产精品免费精品自在线观看| 日韩在线a电影| 91精品精品| 国产精品久久久久蜜臀| 久久精品999| 亚洲小说春色综合另类电影| 国产99久久久国产精品成人免费| 国产精品久久久久久久久久妞妞 | 99久久久久国产精品| 国产精品一级在线观看| 免费的成人av| 欧美~级网站不卡| 精品网站999| 欧美三级第一页| 美女精品在线| 欧美精品一二| 激情欧美日韩一区| 中文字幕高清在线播放| 国产欧美一区二区三区国产幕精品| 爽好多水快深点欧美视频| 91精品一区国产高清在线gif | 中文字幕在线视频久| 国产日韩精品视频一区二区三区| 伊人久久亚洲| 欧美精品激情| 亚洲成人精品| 播放一区二区| 日本精品影院| 欧美日韩精品免费观看视欧美高清免费大片 | 亚洲美洲欧洲综合国产一区| 日韩免费福利视频| 色在线视频观看| yellow在线观看网址| 精品美女久久| 欧美激情国产在线| 久久男人天堂| 日韩国产欧美一区二区| 成人在线超碰| 中文字幕人成乱码在线观看| 超碰在线99| 麻豆视频在线看| 国产中文在线播放| 日韩欧美三级| 久久影院一区| 日韩一区二区免费看| 精品一区在线| 丝袜亚洲另类欧美| 婷婷亚洲精品| 久久精品av麻豆的观看方式| 欧美欧美黄在线二区| 国产探花在线精品一区二区| 国产日本精品| 国产福利91精品一区二区| 日韩理论视频| 蜜臀av免费一区二区三区| 99国产精品99久久久久久粉嫩| 亚洲综合丁香| 天堂俺去俺来也www久久婷婷| 欧美另类中文字幕| 久久精品网址| 最新中文字幕在线播放| 日韩在线不卡| 亚洲深夜av| 日韩激情一区二区| 久久中文字幕一区二区三区| 97国产成人高清在线观看| 在线视频观看日韩| 蜜桃视频一区二区三区| 日韩综合一区二区| 国产精品xvideos88| 四季av一区二区凹凸精品| 91精品国产福利在线观看麻豆| 亚洲一区免费| 国产日韩一区二区三区在线播放| 色爱综合网欧美| 久久九九精品| 亚洲欧美视频一区二区三区| 日韩区欧美区| 国内精品麻豆美女在线播放视频| 午夜av成人| 亚洲精品成人一区| 欧美激情亚洲| 久久青草久久| 中文字幕亚洲精品乱码| 国产欧美欧美| 欧美日韩在线二区| 日本成人一区二区| 国产精品不卡| 视频一区二区三区在线| 国产精品欧美三级在线观看 | 欧美国产中文高清| 91精品一区二区三区综合在线爱| 日韩中文字幕不卡| 久久中文精品| 91成人精品| 国产精品乱战久久久| 欧美日中文字幕| 国产亚洲电影| 九九久久婷婷| 你懂的网址国产 欧美| 久久免费大视频| 少妇精品久久久一区二区 | 美女毛片一区二区三区四区最新中文字幕亚洲| 91欧美国产| 亚洲tv在线| 日本国产精品| 久久精品99国产精品| 91精品一区二区三区综合在线爱 | 国产日韩一区| 精品一区在线| 麻豆精品在线观看| 亚洲一区二区三区高清不卡| 国产精品4hu.www| 欧美一级精品| 国产精品xxx| 亚洲欧美日本国产专区一区| 精品国产欧美日韩一区二区三区| 黄色亚洲精品| 日本不良网站在线观看| 日韩国产欧美视频| 欧美91视频| 精品国产精品久久一区免费式 |