日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術(shù)文章
文章詳情頁

PHP中使用DOMDocument來處理HTML、XML文檔的示例

瀏覽:176日期:2022-09-07 14:46:39

其實(shí)從PHP5開始,PHP就為我們提供了一個強(qiáng)大的解析和生成XML相關(guān)操作的類,也就是我們今天要講的 DOMDocument 類。不過我估計大部分人在爬取網(wǎng)頁時還是會喜歡用正則去解析網(wǎng)頁內(nèi)容,學(xué)了今天的這個類下回就可以嘗試下使用這個PHP自帶的方式來進(jìn)行解析分析了。

解析HTML

// 解析 HTML$baidu = file_get_contents(’https://www.baidu.com’);$doc = new DOMDocument();@$doc->loadHTML($baidu);// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd// 獲取所有圖片的鏈接$allImageLinks = [];$imgs = $doc->getElementsByTagName(’img’);foreach($imgs as $img){ $allImageLinks[] = $img->getAttribute(’src’);}print_r($allImageLinks);// Array// (// [0] => //www.baidu.com/img/baidu_jgylogo3.gif// [1] => //www.baidu.com/img/bd_logo.png// [2] => http://s1.bdstatic.com/r/www/cache/static/global/img/gs_237f015b.gif// )// 利用 parse_url 分析鏈接foreach($allImageLinks as $link){ print_r(parse_url($link));}// Array// (// [host] => www.baidu.com// [path] => /img/baidu_jgylogo3.gif// )// Array// (// [host] => www.baidu.com// [path] => /img/bd_logo.png// )// Array// (// [scheme] => http// [host] => s1.bdstatic.com// [path] => /r/www/cache/static/global/img/gs_237f015b.gif// )

是不是感覺好清晰,好有面向?qū)ο蟮母杏X。就像第一次使用 ORM庫 來進(jìn)行數(shù)據(jù)庫操作一樣的感覺。我們一段一段來看。

$baidu = file_get_contents(’https://www.baidu.com’);$doc = new DOMDocument();@$doc->loadHTML($baidu);

首先是加載文檔內(nèi)容,這個比較好理解,直接使用 loadHTML() 方法加載 HTML 內(nèi)容。它還提供了其它的幾個方法,分別是:load() 從一個文件加載XML;loadXML() 從字符串加載XML;loadHTMLFile() 從文件加載HTML。

// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd

首先是加載文檔內(nèi)容,這個比較好理解,直接使用 loadHTML() 方法加載 HTML 內(nèi)容。它還提供了其它的幾個方法,分別是:load() 從一個文件加載XML;loadXML() 從字符串加載XML;loadHTMLFile() 從文件加載HTML。

// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd

接下來我們使用和前端 JS 一樣的 DOM 操作API來操作HTML里面的元素。這個例子中就是獲取百度的文本框,直接使用 getElementById() 方法獲得id為指定內(nèi)容的 DOMElement 對象。然后就可以獲取它的值、屬性之類的內(nèi)容了。

// 獲取所有圖片的鏈接$allImageLinks = [];$imgs = $doc->getElementsByTagName(’img’);foreach($imgs as $img){ $allImageLinks[] = $img->getAttribute(’src’);}print_r($allImageLinks);// Array// (// [0] => //www.baidu.com/img/baidu_jgylogo3.gif// [1] => //www.baidu.com/img/bd_logo.png// [2] => http://s1.bdstatic.com/r/www/cache/static/global/img/gs_237f015b.gif// )// 利用 parse_url 分析鏈接foreach($allImageLinks as $link){ print_r(parse_url($link));}// Array// (// [host] => www.baidu.com// [path] => /img/baidu_jgylogo3.gif// )// Array// (// [host] => www.baidu.com// [path] => /img/bd_logo.png// )// Array// (// [scheme] => http// [host] => s1.bdstatic.com// [path] => /r/www/cache/static/global/img/gs_237f015b.gif// )

這一段例子則是獲取HTML文檔中所有的圖片鏈接。相比正則來說,是不是方便很多,而且代碼本身就是自解釋的,不用考慮正則的匹配失效的問題。配合另外一個PHP中自帶的 parse_url() 方法也能非常方便地對鏈接進(jìn)行分析,提取自己想要的內(nèi)容。

XML的解析和對HTML的解析也是類似的,都使用 DOMDocument 和 DOMElement 提供的這個方法接口就可以很方便的進(jìn)行解析了。那么我們想要生成一個標(biāo)準(zhǔn)格式的XML呢?當(dāng)然也非常的簡單,不需要再去拼接字符串了,使用這個類一樣的進(jìn)行對象化的操作。

生成一個XML

// 生成一個XML文檔$xml = new DOMDocument(’1.0’, ’UTF-8’);$node1 = $xml->createElement(’First’, ’This is First Node.’);$node1->setAttribute(’type’, ’1’);$node2 = $xml->createElement(’Second’);$node2->setAttribute(’type’, ’2’);$node2_child = $xml->createElement(’Second-Child’, ’This is Second Node Child.’);$node2->appendChild($node2_child);$xml->appendChild($node1);$xml->appendChild($node2);print $xml->saveXML();/*<?xml version='1.0' encoding='UTF-8'?><First type='1'>This is First Node.</First><Second type='2'><Second-Child>This is Second Node Child.</Second-Child></Second>*/

其實(shí)只要有一點(diǎn)點(diǎn)的前端 JS 的基礎(chǔ)都不難看出這段代碼的含義。使用 createElement() 方法創(chuàng)造 DOMElement 對象,然后就可以為它添加屬性和內(nèi)容。使用 appendChild() 方法就可以為當(dāng)前的 DOMElement 或者 DOMDocument 添加下級節(jié)點(diǎn)。最后使用 saveXML() 就能夠生成標(biāo)準(zhǔn)的XML格式內(nèi)容了。

總結(jié)

通過上面兩個簡單的小例子,相信大家已經(jīng)對這個 DOMDocument 操作XML類文件解析的方式非常感興趣了。不過相對于正則解析的方式它們的性能有多大的差異并沒有找到相關(guān)的測試,不過一般正常的情況下網(wǎng)站的HMTL文檔都不會太大,畢竟各個網(wǎng)站也會考慮自身的加載速度,如果文檔非常大的話用戶體驗(yàn)也會很差,所以這套接口用來進(jìn)行日常爬蟲的分析處理工作基本是沒有任何問題的。

測試代碼: github.com/zhangyue050…

以上就是PHP中使用DOMDocument來處理HTML、XML文檔的示例的詳細(xì)內(nèi)容,更多關(guān)于PHP DOMDocument處理HTML、XML的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: PHP
相關(guān)文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
久久gogo国模啪啪裸体| 不卡一区2区| 噜噜噜躁狠狠躁狠狠精品视频 | 日韩av资源网| 日韩福利在线观看| 国产精品宾馆| 91亚洲人成网污www| 日本在线啊啊| 精品一区毛片| 亚洲理论在线| 91精品国产自产观看在线| 91午夜精品| 日韩中文字幕| 7m精品国产导航在线| 国产欧美精品| 日韩福利一区| 免费欧美在线视频| 久久精品xxxxx| 在线天堂中文资源最新版| 亚洲尤物av| 久久久久免费av| 国产精品毛片一区二区三区| 蜜臀久久久久久久| 日本一区福利在线| 国产欧美啪啪| 欧美日韩黑人| 久久国际精品| 日韩国产一区二区三区| 模特精品在线| 日韩精品亚洲专区| 国产中文欧美日韩在线| 国产精品久一| 中文久久精品| 国产精品精品| 日本aⅴ免费视频一区二区三区| 97精品国产福利一区二区三区| 香蕉久久精品| 国产情侣一区在线| 国产精品91一区二区三区| 久久国产人妖系列| 视频一区视频二区中文字幕| 卡一精品卡二卡三网站乱码| 久久伊人亚洲| 国产精品97| 欧美成人精品午夜一区二区| 日韩一区二区免费看| 免费在线日韩av| 亚洲欧美一级| 免费精品国产的网站免费观看| 欧美偷窥清纯综合图区| 免费日韩一区二区| 日本精品不卡| 欧美激情99| 亚洲资源网站| 欧美在线资源| 麻豆久久久久久| 日本va欧美va欧美va精品| 秋霞国产精品| 美女视频免费精品| 日韩欧美中文在线观看| 亚洲免费在线| 99久久精品网站| 麻豆精品蜜桃| 肉色欧美久久久久久久免费看| 久久成人av| 国产精品nxnn| 国产精品丝袜在线播放| 日韩激情精品| 欧美三级第一页| 亚洲免费专区| 视频在线观看一区| 九九精品调教| 欧洲亚洲一区二区三区| 国产videos久久| 狠狠躁少妇一区二区三区| 欧美一区二区三区久久精品| 日本强好片久久久久久aaa| 青青草91视频| 国产成人精品一区二区三区视频 | 国产91精品对白在线播放| 日韩欧美一区免费| 亚洲精品99| 亚洲三级观看| 美女高潮久久久| 日韩欧美美女在线观看| 日本免费在线视频不卡一不卡二| 日本国产亚洲| 日韩成人精品一区二区| 久久一区二区三区喷水| 国产精品婷婷| 久久99久久人婷婷精品综合| 久久精品国产999大香线蕉| av中文字幕在线观看第一页| 天堂а√在线最新版中文在线| 日韩影片在线观看| 国产免费av一区二区三区| 精品理论电影在线| 一本一道久久a久久精品蜜桃| 久久亚洲视频| 日韩毛片网站| 国产一区二区三区免费在线 | 久久99蜜桃| 亚洲在线免费| 韩日一区二区| 蜜桃免费网站一区二区三区| 麻豆久久一区二区| 亚洲欧美日韩专区| 麻豆一区二区在线| 亚洲专区视频| 99视频精品视频高清免费| 欧美亚洲国产日韩| 神马久久午夜| 91欧美日韩在线| 欧美日韩国产传媒| 荡女精品导航| 日韩精品一区二区三区中文 | 久久电影一区| 亚洲黄色免费av| 欧美亚洲一区二区三区| 在线视频精品| 亚洲激情二区| 国产一区二区三区网| 日韩欧美2区| 日韩中文字幕91| 欧美日韩国产免费观看视频| 国产一区二区三区四区二区| 日韩高清二区| 亚洲91网站| 蜜桃视频免费观看一区| 国产高清一区二区| 国产91一区| 婷婷激情综合| aⅴ色国产欧美| 五月精品视频| 在线午夜精品| 国产视频一区免费看| 日韩精品欧美激情一区二区| 日本久久精品| 在线看片国产福利你懂的| 久久精品国产免费| 国产精品对白久久久久粗| 欧美日韩91| 国产探花一区二区| 亚洲综合不卡| 亚洲欧洲免费| 亚洲精品影院在线观看| 蜜臀精品一区二区三区在线观看| 自由日本语亚洲人高潮| 久久亚洲欧美| 国产欧美自拍| 欧美日韩免费看片| 播放一区二区| 亚洲欧美日本国产专区一区| 日本中文字幕一区二区| 国产精品超碰| 欧美亚洲国产精品久久| 视频一区二区欧美| 国产精品v一区二区三区| 国产精品久久久久蜜臀| 国产真实久久| 国产丝袜一区| 亚洲二区精品| 久久精品国产亚洲aⅴ| 最新国产拍偷乱拍精品| 国产日韩在线观看视频| 久久亚洲精品中文字幕蜜潮电影| 视频一区二区国产| 国产精品mv在线观看| 爽好多水快深点欧美视频| 成人午夜在线| 婷婷精品久久久久久久久久不卡| 日韩综合在线| 精品福利久久久| 亚洲精品美女| 日本大胆欧美人术艺术动态| 国产精品第十页| 国产激情综合| 九一精品国产| 国产精品久久乐| 视频福利一区| 欧洲av一区二区| 一区在线免费| 欧美三区不卡| 欧美日韩中文字幕一区二区三区 | 欧美精品自拍| 日韩av二区在线播放| 久草免费在线视频| 精品1区2区3区4区| 国产午夜精品一区在线观看| 热三久草你在线| 91九色精品| 动漫av一区| 国产欧美在线观看免费| 亚洲国产不卡| 水野朝阳av一区二区三区| 国产一区调教| 日本久久一区| 美女网站一区| 三上悠亚国产精品一区二区三区| 国产亚洲字幕|