BeautifulSoupは崩れたHTMLも強引に解釈してくれる


ゆえに、変なファイルを読み込ませてprettifyしたら、びっくりした。
(正確にはびっくりして、元ファイルが変なのに気づいた)


変換前

<table>
&#160;<tr>
&#160;&#160;<td>
&#160;&#160;&#160;表の中身
&#160;&#160;&#160;(なが〜〜いコード)
&#160;&#160;&#160;表の中身
&#160;&#160;<tr/>
&#160;</td>
</table>
<table>
&#160;<tr>
&#160;&#160;<td>
&#160;&#160;&#160;表の中身
&#160;&#160;&#160;(なが〜〜いコード)
&#160;&#160;&#160;表の中身
&#160;&#160;<tr/>
&#160;</td>
</table>

変換後

<table>
&#160;<tr>
&#160;</tr>
</table>

なんとまあ、短くなっちゃって。

広告を非表示にする