日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

html5 - python 處理html頁面爬蟲數據

瀏覽:198日期:2022-09-23 15:40:47

問題描述

請求的url 數據http://www.hkex.com.hk/chi/st...對了我只抓取一張表,希望能夠提取關鍵表的數據.

希望抓取的數據是該成交報表,但是HTML 的標簽都是<pre>造成了數據提取的困難。

賣空成交量 成交量

代號 股票名稱 股數(SH) 金額($)股數(SH) 金額($)

1 長和 299,500 27,572,475 2,201,171 202,964,029 2 中電控股 61,000 4,622,825 1,452,853 110,040,699 3 香港中華煤氣 2,939,000 42,694,880 8,024,558 116,691,466 4 九龍倉集團  297,000 17,349,550 3,136,238 183,105,286 5 匯豐控股 1,102,800 73,202,940 8,630,868 572,622,103 6 電能實業 1,016,500 76,262,725 4,876,990 365,926,231 8 電訊盈科 731,000 3,478,240 13,579,32364,672,175 10 恒隆集團 172,000 5,209,850 967,98029,308,292 11 恒生銀行 189,000 30,047,370 1,075,185 170,873,130 12 恒基地產 94,000 4,025,500 1,382,53359,183,598 14 希慎興業 33,000 1,167,900 642,42422,747,393 16 新鴻基地產  425,000 45,490,800 1,635,959 175,284,039 17 新世界發展  651,000 5,833,670 10,135,38190,633,244 19 太古股份公司A  132,000 10,405,600 554,96243,709,235 20 會德豐  72,000 3,407,750 683,36832,286,993 23 東亞銀行 451,600 14,991,890 1,817,00060,295,348 27 銀河娛樂 1,134,000 40,408,550 15,089,117 538,712,668 31 航天控股 210,000 211,580 4,367,526 4,386,198 34 九龍建業 31,000 228,260 292,000 2,156,291 35 遠東發展 10,00033,600 428,075 1,440,321 38 第一拖拉機股份  8,00038,200 1,634,000 7,825,940 41 鷹君 12,000 422,400 470,14616,546,562 45 大酒店  35,500 305,605 503,559 4,335,522

url = 'http://www.hkex.com.hk/chi/stat/smstat/dayquot/d20170202c.htm' response = requests.get(url) if response.status_code == 200:soup = BeautifulSoup(response.content, 'lxml')

應該如何提取該表格的數據內容。

問題解答

回答1:解決方法一:

首先先定位賣空成交量位置 a = soup.find(’a’, attrs={’name’:’short_selling’}),然后根據pre->font的相鄰關系,一直往下走直到列不到6行就結束

這是結果:

[[’代號’, ’股票名稱’, ’股數(SH)’, ’金額($)’, ’股數(SH)’, ’金額($)’], [’1’, ’長和’, ’299,500’, ’27,572,475’, ’2,201,171’, ’202,964,029’], [’2’, ’中電控股’, ’61,000’, ’4,622,825’, ’1,452,853’, ’110,040,699’], [’3’, ’香港中華煤氣’, ’2,939,000’, ’42,694,880’, ’8,024,558’, ’116,691,466’],....源代碼

import pprintfrom bs4 import BeautifulSoupimport requestsr = requests.get(’http://www.hkex.com.hk/chi/stat/smstat/dayquot/d170202c.htm’)r.encoding = ’big5’soup = BeautifulSoup(r.text)a = soup.find(’a’, attrs={’name’:’short_selling’})data = []pre = a.find_parent(’pre’)for line in pre.font.text.splitlines(): item = line.strip().split() if len(item) == 6:data.append(item)end = Falsefor next_pre in pre.next_siblings: for line in next_pre.font.text.splitlines():item = line.strip().split()if len(item) > 7: item = item[1:2] + [''.join(item[1:-4])] + item[-4:]elif len(item) < 6: end = True breakdata.append(item) if end: breakpprint.pprint(data)回答2:

給你一個方案吧。

因為這些數據都是文本信息,沒有標簽包圍。通過抓包,也沒有發現特定的數據查詢接口。所以數據應該是服務器生成好的通過html寫死的發送給瀏覽器。那么發現這些數據項每一個特定的屬性都是占用同樣的位置大小且居右對齊,而且每一項有特定的格式,可以使用正則表達式進行提取。具體還是請您自行實現吧。回答3:

干嘛這么麻煩用beautifulsoup,殺雞焉用牛刀

你的網頁只有一行行數據啊,格式簡單的不能再簡單

你直接把頁面上的數據復制下來,保存成txt,然后用readline、split、正則表達式提取數據不就可以了嘛

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
成人在线免费观看网站| 国产精品午夜av| 久久久久久久久99精品大| 国产99在线| 欧美不卡高清一区二区三区| 伊人久久国产| 国产一区日韩一区| 99在线观看免费视频精品观看| 免费污视频在线一区| 狠狠久久伊人| 日韩国产欧美| 久久精品播放| 影音先锋国产精品| 日韩精品一级中文字幕精品视频免费观看| 亚洲欧美日韩精品一区二区| 伊人久久一区| 国产亚洲字幕| 精品国产中文字幕第一页| 日韩成人a**站| 99久久精品网| 视频一区视频二区中文字幕| 日本不卡不码高清免费观看| 国产精品一区二区中文字幕| 麻豆国产欧美日韩综合精品二区| 国产精品毛片aⅴ一区二区三区| 国产精品久久久久77777丨| 你懂的网址国产 欧美| 伊人网在线播放| 午夜精品免费| 日本午夜免费一区二区| 国产成人免费视频网站视频社区| 欧美一级鲁丝片| 91精品成人| 日韩综合小视频| 精品国产99| 激情综合激情| 欧美一级网站| 亚洲天堂免费电影| 日韩中文字幕区一区有砖一区| 日韩高清一区| 国产成人调教视频在线观看| 一区二区小说| 日本电影久久久| 成人av三级| 综合国产在线| 欧美日韩国产观看视频| 日韩在线一二三区| 精品成人18| 美女精品在线观看| 欧美激情网址| 亚洲一区二区三区免费在线观看| 国产日韩欧美三区| 欧美一区二区三区激情视频| 欧美一区精品| 桃色一区二区| 日韩av中文在线观看| 国产色播av在线| 日韩精品亚洲专区| 久久久国产亚洲精品| 日韩二区在线观看| 久久在线免费| 国产一卡不卡| 亚洲福利国产| 国产精品香蕉| 亚洲一区二区成人| 97精品国产福利一区二区三区| 亚洲乱码视频| 久久久精品日韩| 国产精品亚洲片在线播放| 亚洲91久久| 国产精品一区二区三区www| 亚洲精品午夜av福利久久蜜桃| 国产精品xvideos88| 国产亚洲激情| 国产99在线| 国产精品调教| 亚洲精品大全| 91成人精品视频| 岛国av在线播放| 国产精品调教视频| 亚洲精品一区二区在线播放∴| 久久中文视频| 国产成人精品三级高清久久91| 少妇精品久久久| 久久久成人网| 精品五月天堂| 国产欧美日韩| 亚洲欧美久久精品| 日韩亚洲在线| 精品成人免费一区二区在线播放| 国产精品xxx在线观看| 日韩一区二区三区免费视频| 亚洲免费观看| 91精品久久久久久久久久不卡| 欧美激情综合| 国产欧美一区二区色老头| 亚洲精一区二区三区| 最新亚洲激情| 免费成人网www| 福利视频一区| 国产精品115| 国产免费av一区二区三区| 日本成人中文字幕| 亚洲人成亚洲精品| 日韩在线一二三区| 久久福利毛片| 国产精品婷婷| 免费日韩一区二区| 欧美精品一卡| 五月天综合网站| 黄色不卡一区| 亚洲五月婷婷| 久久国产小视频| 欧美香蕉视频| 国产在线不卡一区二区三区| 国产精品久久久久久久久免费高清 | 久久不射中文字幕| 91精品99| 久久成人国产| 中文一区一区三区免费在线观 | 日韩avvvv在线播放| 日韩成人一级| 日韩av一级片| 日本aⅴ免费视频一区二区三区| 中文无码久久精品| 亚洲视频国产精品| 日日夜夜免费精品| 日本成人在线网站| 国产精品色在线网站| 久久av影院| 美女尤物国产一区| 国产成人久久精品一区二区三区| 欧美激情另类| 久久精品99久久无色码中文字幕| 久久蜜桃av| 免费久久99精品国产自在现线| 中文字幕日韩亚洲| 久久国产精品色av免费看| 久久精品日韩欧美| 日韩精品1区| 一区在线免费| 日韩在线一二三区| 日韩精彩视频在线观看| 国产精品九九| 在线中文字幕播放| 久久久久国产| 欧美中文日韩| 日本中文字幕视频一区| 欧美日韩在线精品一区二区三区激情综合| 国产精品亚洲欧美一级在线| 精品视频一区二区三区在线观看 | 亚洲综合二区| 日本一区福利在线| 国产精品99久久久久久董美香| 美女毛片一区二区三区四区最新中文字幕亚洲 | 久久99精品久久久久久园产越南| 国产在视频一区二区三区吞精| 久久五月天小说| 蜜桃视频在线观看一区二区| 国产欧美三级| 成人午夜精品| 首页欧美精品中文字幕| 国产欧美一级| 久久国产精品成人免费观看的软件| 在线一区欧美| 国产日产精品_国产精品毛片| 97精品中文字幕| 日韩精品一二三区| 国语对白精品一区二区| 亚洲免费观看| 国产精品视频一区二区三区四蜜臂 | 国产精品毛片aⅴ一区二区三区| 91日韩免费| 日韩影院精彩在线| 精品久久影院| 夜夜精品视频| 久久久久九九精品影院| 欧美日韩免费观看一区=区三区| 日韩高清三区| 99久久久久久中文字幕一区| 亚洲视频电影在线| zzzwww在线看片免费| 中文字幕一区二区三区四区久久| 麻豆国产精品777777在线| 九一精品国产| 欧美黄色一区| 欧洲毛片在线视频免费观看| 国产亚洲欧美日韩精品一区二区三区 | 日韩激情一二三区| 亚洲不卡av不卡一区二区| 日韩黄色免费网站| 久久婷婷丁香| 久久精品xxxxx| 欧美aa国产视频| 精品视频自拍| 日韩在线观看一区二区三区| 亚洲爱爱视频| 久久99久久久精品欧美| 免费黄网站欧美| 亚洲成人精品|