コードポイント単位をネイティブで処理したいときはメモリに UTF-32 で載せるのが効率良いだろうし、中身をそこまで激しく操作しないなら UTF-8 で十分というのもある
UTF-8 はそのままバイト列として辞書順比較するとナイーブなコードポイント単位での比較になるという神エンコードなので
Mastodonに参加して、世界で起きていることを見つけよう。
連合内の誰でもフォローして投稿を時系列で見ることができます。アルゴリズム、広告、クリックベイトはありません。