ジャックドーシーがFediverse2(ツー)作ってるマジ?
adx/architecture.md at main · bluesky-social/adx
https://github.com/bluesky-social/adx/blob/main/architecture.md#personal-data-servers-pds 読んでいます。
えーと、Fediverseでは投稿やいいね履歴などの個人データは本人が所属するサーバにアップロードされ保存される。しかしBlueskyではそれらのデータは個人の端末リポジトリに保存される。これはFediより一歩進んだ個人単位の分散であるが、他ユーザからのアクセスが個人端末に殺到して圧倒する可能性もある。それに耐えきれないユーザのために、Fediのようにユーザが信頼すると見做したサーバにデータをプールしてアクセスを肩代わりさせる「委任クライアント」システムも用意されている。
ようはFediの個人鯖と登録公開鯖の両方があるみたいな感じかな。で、個人リポジトリからの投稿を無差別に取得してモデレーションなしで閲覧できる「スピーチ」レイヤと、任意のキュレーション・モデレーションフィルタを通して適切な情報だけを選び出す「リーチ」レイヤが存在する。リーチレイヤの選別基準はそれを設定する人・組織それぞれであり、ここに市場が存在しうる。この三者の関係は、情報の海であるWebと、そこから必要な情報を選び出す検索エンジンと、最終結果としてユーザの前に表示される検索結果のような感じでとらえることができる。
Fediうんぬんの話は元記事にはなくてわたしが個人的に整理するため付け足しています。
コンテンツモデレーションには2段階のラベル付けが使用される。すなわちマルウェアやスパムを検出する自動ラベラーと、ユーザ自身が不快と見做した投稿に付与できるラベルであり、後者は前者の自動学習の母データとしても機能する。これによってユーザは自分の眼前に何が表示され、何が表示されないかを細かく制御できる。大勢が不快とみなした情報をサーバから削除するしかない現在のSNSからの改善点である。
削除といえば、Blueskyではユーザが投稿したコンテンツや付けたいいねなどのデータは個人のリポジトリに保存され、侵害されることはない。他ユーザからのアクションによってコンテンツそのものが削除されることはないが、モデレーションによって「リーチ」レイヤで非表示にされることはある。
あ、エンドツーエンド暗号化の話や公開鍵の話もあるけど、このへんはわたしのそのへんの技術への理解がそもそも不足しているので触れられません。自分で読んでね。
あっ最後んとこ抜けてた。クロールインデクサーが存在し、個人データサーバのコンテンツをクロールすることで、個人サーバに検索負荷が集中することを防ぎ、運用コストを抑えられると。