一貫性がほしいというのはわかるなぁ。私はそれを「説得力」と呼んだりしているけど
個人的には AI アート (?) には「文脈を (人間から見ると) 破綻させつつも表象ではそれらしく見える」という、まあいわゆるシュールな作品を生成する方向を期待しています。
構文は流用して意味論だけ破壊するような、たとえば “cursed minecraft images” のようなものを。
見た目 (シンタックス) を取り繕うのはかなり得意なはずだから、その裏の一貫した原理 (セマンティクス) だけ破壊してくれれば “シュールなギャグ” を作れるはずなんですよ。たとえば “ラーメンを食べる樋口円香” はそれを実証した具体例ともいえる