https://mathtod.online/@cmplstofB/105751392031826925
これは全面的に賛成。わざわざ HTML パーサと XML パーサを分けるのはバカバカしいし、 <script src="..."></script> と <script src="" /> で挙動が変わるのとか「おまえ XML って知ってるか?」と思わずにはいられない
「既に存在している文法的に破滅した文書の解釈を壊さない」という点で、共通のエラーハンドリングを規定したことに意味はあるんだけど、それは「壊滅した文書のエラーハンドリングの規定」であって「将来的に許容される文法セット」であるべきではなかった、という考えがある
別の表現をするなら、 canonical な文法と、エラーのある記述からそっちに復活させるアルゴリズムは別々であってほしかった。
そんで canonical な文法が XML と互換であればよかったんだけど
<hr/> を <hr></hr> にしてはいけないとか、 <span></span> を <span/> にしてはいけないとか……本当に勘弁してくれ (マジでなんで禁止したのか説明してほしい)
や、どうせ「html5 非対応の処理系でそれなりに表示できるように」とかいろいろあるんだろうけど……
過去未来すべてのエラーを吸収した規格なんて虚淵玄シナリオ一直線じゃん、そんな規格に未来を託したくない