日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

Python selenium如何打包靜態(tài)網(wǎng)頁并下載

瀏覽:31日期:2022-07-14 11:46:11

需求:單純的將page.source寫入文件的方式,會(huì)導(dǎo)致一些圖片無法顯示,對于google瀏覽器,直接將頁面打包下載成一個(gè)mhtml格式的文件,則可以進(jìn)行離線下載。對應(yīng)python selenium 微信公眾號歷史文章隨手一點(diǎn)就返回首頁?郁悶之下只好將他們都下載下來。:https://www.jb51.net/article/193111.htm

遇到的問題:

1、單純使用webdriver.ActionChains無法完成下載動(dòng)作,未能操作windows窗口。

2、沒有找到相關(guān)能直接下載.mhtml的命名接口。

3、pywin32置頂窗口的使用不順利。

解決思路:

1、使用selnium打開瀏覽器,不要操作,讓其保持置頂

2、使用pyautogui、pyperclip操作鍵盤、鼠標(biāo)、剪切板進(jìn)行下載文件。

準(zhǔn)備材料:

需要將自動(dòng)化操作的一些圖片截取下來,以作為后期圖片匹配使用。

Python selenium如何打包靜態(tài)網(wǎng)頁并下載

實(shí)現(xiàn):

1、打開爬取好的鏈接,遍歷所有需要下載的頁面

# 讀取文件filename = r’data/01 爬取微信公眾號歷史文章/urls 二律背反的一燈如豆-out.xlsx’df = pd.read_excel(filename,dtype=object)df = df.reindex(columns=[’日期’, ’標(biāo)題’, ’原創(chuàng)’, ’地址’,’完成情況’,’儲存地址’])#df = df.head(5)dfsel = (df[’標(biāo)題’] !=’隨文’) & (df[’完成情況’] != 1)save_folder = r'I:codepythondata01 爬取微信公眾號歷史文章01 二律背反的一燈如豆' + ''# 設(shè)置保存格式為 mhtml,減少要操作文件保存下拉框的情況options = webdriver.ChromeOptions()options.add_argument(’--save-page-as-mhtml’)# 啟動(dòng)瀏覽器driver = webdriver.Chrome(options=options)wait = WebDriverWait(driver,10)df.loc[dfsel,'完成情況'],df.loc[dfsel,'儲存地址'] = zip(*df[dfsel].apply(download_mhtml_with_not_check, axis=1,args=(driver,wait)))

2、編寫相關(guān)下載頁面函數(shù)

# 在timeout秒內(nèi),返回中心值,間隔時(shí)長time_setp# 封裝一個(gè)pyautogui限時(shí)查找函數(shù)#def finde_gui_element(png,timeout = 5,time_setp=0.2): i = 1 if timeout <=0 : timeout = 5 if time_setp <=0 : time_setp = 0.2 while True: if i > timeout/time_setp: return None center = pyautogui.locateCenterOnScreen(png,grayscale=False,confidence=0.9) if center == None: time.sleep(0.2) else: return center i = i + 1

主要自動(dòng)化操作代碼:

def download_mhtml_with_not_check(x,driver,wait): name = ’’ try: url = str(x[’地址’]) driver.get(url) # 獲取瀏覽器標(biāo)題,用于檢測是否是置頂頁 wait.until(EC.presence_of_element_located((By.XPATH,’//h2[@id='activity-name']’))) title = driver.find_element_by_xpath(’//h2[@id='activity-name']’).text print(’no:’,x.name,’url:’,url,’title:’,title) wait.until(EC.presence_of_element_located((By.XPATH,’//div[@id='page-content']’))) #進(jìn)入下載 pyautogui.hotkey(’ctrl’, ’s’) # 等待一下對話框彈出 time.sleep(1) bt = finde_gui_element(r’datapngsave.png’) #查找保存按鍵 if bt == None: return (0,’’) else: # 根據(jù)標(biāo)題組合成具體路徑 name = save_folder + ’ ’ + title + ’.mhtml’ #print(name) pyperclip.copy(name) pyautogui.hotkey(’ctrl’, ’v’) time.sleep(0.1) pyautogui.hotkey(’Enter’) # 檢查是否彈出另存為 bt = finde_gui_element(r’datapngconfirmsaveas.png’,timeout=0.5) if bt != None: # 說明出現(xiàn)重復(fù)明明,點(diǎn)擊覆蓋 pyautogui.hotkey(’Tab’) pyautogui.hotkey(’Enter’) return (1,name) bt = finde_gui_element(r’datapngcancle.png’,timeout=0.5) if bt != None: #還愛,說明出現(xiàn)了一些異常 pyautogui.hotkey(’esc’) pyautogui.hotkey(’esc’) pyautogui.leftClick(bt) return (-1,name) # 加多一個(gè)esc防止出現(xiàn)窗口還在 pyautogui.hotkey(’esc’) except Exception as e: print(str(e)) return (-2,name) return (1,name)

最后寫入excel:

Python selenium如何打包靜態(tài)網(wǎng)頁并下載

通過vba代碼,將單元格地址添加上超鏈接:

Option ExplicitSub add_hype() Dim ws As Worksheet, arr As Variant, i As Long Set ws = ThisWorkbook.Worksheets(1) arr = ws.UsedRange.Value ws.Cells.Hyperlinks.Delete For i = 2 To UBound(arr) If CStr(arr(i, 2)) = '隨文' Then Else If CStr(arr(i, 5)) = '1' Then ws.Hyperlinks.Add Anchor:=ws.Cells(i, 6), Address:=CStr(arr(i, 6)) End If End If Next i End Sub

完成。

不足之處:

1、通過autogui操作,難免會(huì)遇到彈窗的情況,需要增加活動(dòng)窗體置頂,但是一直沒有找到有效的方法。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: Python 編程
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久久久久黄| 亚洲欧美一区在线| 日韩三区四区| 日本不卡视频一二三区| 男女男精品网站| 亚洲激情中文| 久久午夜精品| 一区二区国产在线| 最新国产精品久久久| 亚洲1区在线| 久久精品99国产精品| 国产欧美69| 国产一区丝袜| 亚洲天堂1区| 狠狠操综合网| 鲁大师成人一区二区三区| 综合欧美亚洲| 欧美亚洲一区二区三区| 你懂的国产精品永久在线| 国产成人久久精品麻豆二区| 精品高清久久| 美女网站一区| 亚州av一区| 麻豆成人91精品二区三区| 欧洲精品一区二区三区| 视频一区中文字幕| 国产日本亚洲| 日本不卡免费高清视频在线| 99riav国产精品| 欧美日韩一区二区高清| 精品九九在线| 黄色成人精品网站| 亚洲精品大全| 高清一区二区三区av| 在线日韩欧美| 在线日韩成人| 久久精品天堂| 激情五月色综合国产精品| 蜜桃视频在线观看一区二区| 国产精品白丝久久av网站| 人人草在线视频| 亚洲免费观看高清完整版在线观| 精品一区二区三区亚洲| 91精品二区| 国产亚洲久久| 久久精品av| 久久国产精品免费精品3p| 精品欧美一区二区三区在线观看| 亚洲最新av| 国产精品原创| 久久午夜精品| 国产色播av在线| 亚洲一区有码| 中文字幕在线视频久| 六月天综合网| 蜜臀国产一区| 日本视频在线一区| 久久精品播放| 免费一级欧美片在线观看网站| 一区二区视频欧美| 国产精品对白| 蜜桃视频一区二区三区在线观看| 国产videos久久| 久久国产精品毛片| 中文字幕人成乱码在线观看 | 国产自产自拍视频在线观看| 丝袜美腿亚洲色图| а√天堂8资源在线| 日韩一区二区三区高清在线观看| 久久精品国语| 蜜桃精品视频| 日韩国产欧美视频| 欧美另类专区| 91亚洲国产| 欧美日韩午夜电影网| 影音先锋久久| 精品免费视频| 奇米色欧美一区二区三区| 欧美成人综合| av最新在线| 国产精品大片| 日韩高清一区在线| 久久都是精品| 999国产精品视频| 久久精品系列| 欧美一区免费| 亚洲精品女人| 亚洲欧洲午夜| 久久人人97超碰国产公开结果| 麻豆成人在线观看| 欧美一区精品| 免费在线成人网| 亚洲精品小说| 欧美sss在线视频| 精品国产乱码久久久久久1区2匹| 亚洲不卡视频| 鲁大师成人一区二区三区| 亚洲第一区色| 亚洲成人精品| 日韩精品中文字幕第1页| 麻豆久久久久久| 国产精品视频一区视频二区| 日本不卡不码高清免费观看| 国产亚洲网站| 在线国产一区| 久久国产亚洲| 国产一二在线播放| 国产传媒在线| 国产传媒av在线| 国产精品久久久久久久久久10秀| 国产精品99久久久久久董美香| 日韩欧美中文在线观看| 综合激情婷婷| 蜜臀精品一区二区三区在线观看| 一区在线免费观看| 99在线精品免费视频九九视| 午夜精品亚洲| 黑丝一区二区| 99在线精品免费视频九九视| av成人国产| 久久性天堂网| 蜜臀av一区二区在线免费观看 | 免费在线播放第一区高清av| 国产欧美一区二区三区米奇| 国产日产高清欧美一区二区三区| 国产欧美日韩在线一区二区| 久久99蜜桃| 成人在线黄色| 日韩精品影视| 亚洲男女av一区二区| 午夜在线播放视频欧美| 蜜桃视频免费观看一区| 91精品一区| 国产精品欧美大片| 麻豆国产一区| 欧美成人a交片免费看| 日本高清不卡一区二区三区视频| 久久精品卡一| 久热精品在线| 日韩高清不卡一区二区| 国产精品久久久久久妇女 | av免费不卡国产观看| 999国产精品视频| aa国产精品| 日韩成人一级| 免费一级欧美片在线观看网站| 国产精品毛片久久| 在线成人动漫av| 男女性色大片免费观看一区二区| 日韩影片在线观看| 国产精品久久久久9999高清| 国产一区福利| 欧美jjzz| 日本电影久久久| 精品一区二区三区亚洲| 999国产精品| 色综合视频一区二区三区日韩| 国产精品第一| 激情欧美丁香| 日本久久一区| 麻豆精品视频在线观看免费| 国产精品字幕| 蜜桃av一区二区| 国产欧美日韩影院| 日韩精品看片| 香蕉久久久久久| 给我免费播放日韩视频| 国产精品毛片在线| 国产精品日韩精品在线播放| 中文另类视频| 日韩影片在线观看| 97精品一区二区| 蜜桃久久久久久| 精品视频97| 国产农村妇女精品一二区 | 日本视频中文字幕一区二区三区| 高清久久精品| 蜜桃久久精品一区二区| 高清精品久久| 在线精品亚洲| 日韩a一区二区| 日韩精品一二三区| 麻豆精品新av中文字幕| 在线亚洲自拍| 精品一区二区三区亚洲| 亚洲免费网址| 91综合网人人| 日韩高清二区| 久久久久国产精品一区三寸| 日韩高清三区| 亚州av乱码久久精品蜜桃| 国产精品久久久久久久久久齐齐| 午夜久久免费观看| 免费一级欧美在线观看视频| 亚洲欧美日韩国产一区二区| 黄色欧美在线| 日本色综合中文字幕| 亚洲精品小说| 国产精品原创| 国产欧美日韩在线观看视频 |