この問題は以前から気になっていて、本来たとえば日本語文字間の半角空白と改行を無視するようなフォーマットで書いたうえで、それを変換することで成果物を吐くべきだと思うのよね
英語圏のような分かち書きだとインデントも改行も単なる空白扱いで圧縮できるので楽なんだけど、日本語はそうではないので、分かち書きしか想定していないフォーマットを使うとろくなことにならない。 TeX はその点よくできている
markdown も asciidoc も HTML も、その辺りが駄目。まあ HTML はどちらかというと出力側のフォーマットだけど
たとえば日本語文書で謎の半角空白がたくさん混入している web ページなどは、ソースコードで文章の途中で改行している場合が多い