Simple HTML DOM Parser 取得内容のサンプル
2011/06/24
outertext、innertext、plaintextの取得内容のサンプル。
指定したタグ内に特定のタグを含まないものが欲しいんだけど…それを知るために各「Magic attributes」ってヤツの動きをしりたかった。
「$html->find("div")->○○」をprint_r()
ソースの例
<div>あ<div>い</div>う</div>
<div>え</div>
<div>え</div>
「$html->find("div")->outertext」での取得内容
- [0] => <div>あ<div>い</div>う</div>
- [1] => <div>い</div>
- [2] => <div>え</div>
「$html->find("div")->innertext」での取得内容
- [0] => あ<div>い</div>う
- [1] => い
- [2] => え
「$html->find("div")->plaintext」での取得内容
- [0] => あいう
- [1] => い
- [2] => え
「$html->find("ol li")->○○」をprint_r()
ソースの例
<ol>
<li>あ
<ol>
<li>か</li>
<li>き</li>
</ol>
</li>
<li>い</li>
</ol>
<li>あ
<ol>
<li>か</li>
<li>き</li>
</ol>
</li>
<li>い</li>
</ol>
「$html->find("ol li")->outertext」での取得内容
- [0] => <li>あ<ol><li>か</li><li>き</li></ol></li>
- [1] => <li>か</li>
- [2] => <li>き</li>
- [3] => <li>い</li>
「$html->find("ol li")->innertext」での取得内容
- [0] => あ<ol><li>か</li><li>き</li></ol>
- [1] => か
- [2] => き
- [3] => い
「$html->find("ol li")->plaintext」での取得内容
- [0] => あかき
- [1] => か
- [2] => き
- [3] => い