人気順検索のSolrはスケールのためにディスクを捨てた - クックパッド開発者ブログ
https://techlife.cookpad.com/entry/2020/11/25/080000
tmpfs のファイルに write すると遅いので mmap するといいよみたいな話が最後らへんにある
プログラムのファイル読み書きで「mmap」を使うと速度が向上する理由とは? - GIGAZINE
https://gigazine.net/news/20201031-mmap-system-faster-system-call/
こっちも似たような文脈で、ユーザ空間とカーネル空間でのデータコピーの効率が mmap の方が良いと
ripgrep is faster than {grep, ag, git grep, ucg, pt, sift} - Andrew Gallant's Blog
https://blog.burntsushi.net/ripgrep/#subtitles_literal
こっちはちょっと切り口が違って、 mmap 上でのパフォーマンスは良いがセットアップ自体のオーバーヘッドが大きいので、対象ファイルが少ないときだけ mmap するといい感じになるよと
まあ ripgrep の検索は大量の (もしかすると小さな) ファイルを一気に舐めるものなので、そういう観点で mmap のオーバーヘッドが無視できないみたい
シーケンシャルアクセスで全体を読む必要があるからねぇ
検索対象の文字列が fixed string で数 MB 単位とかだと、効率的な検索アルゴリズムが読み飛ばしをするとき mmap だと効率が良いかもしれないけど……まあ想定する意義を感じない条件ではある