[2208.09864] Towards Principled User-side Recommender Systems

推薦システム

前回の Private Walk の続編.

概要

伝統的には推薦システムとは開発側が開発側の為に開発するものだったが, 近年では User-side Recommender System という概念が提唱され始めた(!). 提供されてるレコメンドがフェアでないと思ったユーザーに開かれたシステム. ユーザーはシステムのデータを使えないからログデータ等なしで推薦システムを構築することになる.

この論文ではシステムの推薦から隠されたアイテムの特徴ベクトルが復元できること, これを使って推薦システムが構築できることを見ていく. 理論上可能だがその通りに実装することを効率的ではない. 実用的に 健全な (sound) 推薦システムの実装も見てく. ここで満たすべき3つの性質を提唱する.

記法

問題設定

Service Provider's Official Recommendation System

システムの推薦システムとして item-to-item があるとする. これを Pprov と書く. アイテム i があったとき, 推薦システムは K 個のアイテム列を返す.

Pprov(i)IK

この k 番目を Pprov(i)kI と書こう ( k=1,2,,K) .

ユーザーから見て Pprov の中身は完全にブラックボックスであるのが普通だ. これを fair かつ white-box にするのが目的.

Embedding Assumptions

Pprov の中身が次のようだと仮定する.

x 自体はユーザーからは絶対に見えない. で, やりたいことは Pprov の入出力のサンプルから x を復元すること.

Sensitive Attributes

アイテム i には何か具体的なセンシティブな属性 aiA があるとする. 例えば性別や人種が考えられる. ここではユーザーから観測可能なものだけを取り扱う.

Misc Assumptions

ユーザーは既に何らのアイテム HI についてはインタラクションをしてきていて, それらについては知っていることとする. 例えば購入履歴である. テクニカルな仮定として, PprovH のアイテムをレコメンドすることはないこととする.

提案される方法では H は空集合であっても機能する.

特徴量の復元

次のような推薦グラフ G=(V,E) を考える

実際に Pprov を用いることは出来るから, ユーザーから見て G は観測可能な対象である. ひたすらページをクローリングしてく.

ランクまで考慮することでアイテムの類似度やスコアまで推定することは理論上可能だろうが, 話が難しくなりすぎるのでここでは考慮しない.

特徴ベクトルの復元を考える. ここで距離を保存する変換(平行移動, 回転, 拡大縮小)は無視して考える. それらは kNN の結果を変えないので.

Hashimoto らではこのグラフの上を Random Walk してくことで, 任意の誤差未満で復元できることを示している. (なんか色々条件付きで.)

Alamgir & von Luxburg は, グラフに適切に重みを割り当ててくことで, グラフ上の最短距離が特徴ベクトル間の距離と一致するように出来ることを示した. これを使うことで, グラフ G を与えてアイテム同士(その特徴ベクトル)の距離行列

DRn×n

得られる.

Terada & von Luxburg は, 重みなし k-NN グラフに彼らの提案する Local Oridinal Embeddings (LOE) を割り当てることで復元できたことを示した. ことを示した. これも実際にはなんやかんや条件があるらしいが, ともかく本論文の実験では LOE を使ったそう.

色々言ったがともかく, 推薦グラフ G が手に入ったらアイテムの特徴ベクトルは復元できる. そしてらこれを元にまた推薦システムを構築できるし, fair な推薦をするために後処理を施すこともできる (ETP; Estimate-then-postprocessing).

実験

Figure 1. 二次元のでトイデータから kNN グラフを作って復元する実験. 完璧じゃないけどほぼほぼ復元できてる.

Design Principles

これから User-side Recommendation, Q を設計する. パラメータとして, 非負整数 τ を持たせる. これは fairness と preformance をトレードオフに調整する.

Consistency

Pprov と比較したときに性能がほとんど劣化してないその度合いを指す. 特に τ=0 のときに, Pprov と nDCG が下がってないときに consistent であるという. (全く同じ結果が出せるようになっていれば consistent だ.)

Soundness

どのレコメンド結果 Q(i)IK についても, 各属性 aA に属するアイテムが τ 個以上あること.

iI, |{k[K]Q(i)k=j,aj=a}|τ

Locality

グラフ G の部分だけからでも復元できること. 全てのアイテムについて集めてきてフルな G を作れば復元できるのは良いけど, それだと実用上は大変なので, 一部のアイテムについてだけでもグラフを作って, そのアイテムの分だけでも特徴量ベクトルが復元できると便利.

提案手法, Consul

Consul は consistent で sound で local であることが示されている.

実験

Table 3. Oracle ( Pprov ) をそのまま使うのに比べて Consul を使うと Accuracy/nDCG がどのくらい変わるか. もちろん下がるがその下がり幅が小さいことが大事. また Access では Oracle を何回使うかだが, たいてい 10 回未満で済んでいる.

感想

Consul 自体は, まあそう, といった感じ. 提供されてる item-to-item レコメンダがあって, これを多段で叩くことでバリエーションが増やせるようになる(だからこそ fair なものが作れる)というのはノウハウとしてはなるほど. 特徴量ベクトルが復元できる話は結局, フェアなレコメンドを作りたい話とは関係なかった. それ自体は知識として有用だけど, LOE 単体のレポートな気がする, それは.