相互推薦システムの研究動向のサーベイ

こんにちは。ウォンテッドリーのデータサイエンティストの市村 (@chimuichimu1) です。ウォンテッドリーでは、テクノロジーの力で人と仕事の最適なマッチングを実現するために、推薦システムの開発に取り組んでいます。この記事では、Wantedly Visit で活用されている「相互推薦システム」という技術に注目し、その概要や近年の研究動向を紹介したいと思います。

相互推薦システムとは？

相互推薦システムとは一言で言うと「サービス内のユーザーを互いに推薦し合う」システムのことです。一般的な推薦システムでは、ユーザーからアイテムへの嗜好に基づいて、ユーザーに対してアイテムを推薦します。一方で相互推薦システムでは、推薦されるユーザーと推薦を受け取るユーザーの両方の嗜好に基づき、ユーザーに対してユーザーを推薦します。

相互推薦システムのユースケースとしては、ジョブマッチングやオンラインのデーティングサービスといったものが挙げられます。ウォンテッドリーが提供する人と仕事のマッチング体験は前者のユースケースに該当し、実際に Wantedly Visit では相互推薦システムが活用されています。Wantedly Visit への導入や成果についての詳細は、以下の記事で紹介されています。興味がある方は、ぜひこちらもご覧ください。

こんにちは、ウォンテッドリーでデータサイエンティストをしている林 (@python_walker) です。ウォンテッドリーでは、テクノロジーの力で人と仕事の適材適所を実現するために推薦システムの...

https://www.wantedly.com/companies/wantedly/post_articles/903172

第38回人工知能学会全国大会に協賛し、相互推薦システムの活用事例と技術的課題の紹介を行いました！ | Wantedly Engineer Blog

こんにちは！ウォンテッドリーでデータサイエンティストをしている合田です。ウォンテッドリーは、5月28日から31日に開催された第38回人工知能学会全国大会にプラチナスポンサーとして協賛させていただ...

https://www.wantedly.com/companies/wantedly/post_articles/906940

相互推薦システムのアーキテクチャ

相互推薦システムを実現するアーキテクチャは、一般的に以下の3つのコンポーネントから成ります。

ユーザー A からユーザー B への嗜好スコアを予測するコンポーネント
ユーザー B からユーザー A への嗜好スコアを予測するコンポーネント
それぞれの嗜好スコアを集約するコンポーネント

各方向の嗜好を予測するコンポーネントは、アイテムをユーザーに推薦する一般的な推薦システムで使われる推薦手法（Matrix Factorization など）が使用されます。嗜好スコアを集約する部分では、前のステップで生成された2つのスコアを何らかの方法で集約します。集約されたスコアは、双方向の嗜好を取り入れた「マッチ度」を表現するスコアであり、このスコアに基づいてユーザー A あるいは B に対する推薦を作成します。

相互推薦システムの特徴

アイテムをユーザーに推薦する一般的な推薦システムと比較して、相互推薦システムにはいくつかの特徴があります。ここでは相互推薦システムに関する論文 (Pizzato et al. (2010), Palomares et al. (2021)) からいくつかの特徴を抜粋し解説します。

双方向の嗜好の考慮が必要

アイテムをユーザーに推薦する一般的な推薦システムにおいては、そのユーザーがそのアイテムを気に入りさえすれば推薦は成功と言えます。一方で相互推薦システムでは、推薦を受けたユーザー A が推薦対象のユーザー B を気に入ったとしても、逆にユーザー B はユーザー A に興味がないかもしれません。このようなケースでは、ユーザー A がユーザー B に対して好意を送ったとしても、最終的にマッチングするのは難しいでしょう。このように相互推薦システムの推薦が成功するためには、双方向の嗜好が成り立つ必要があります。

ユーザーのキャパシティの存在

相互推薦システムが扱うサービスにおいては、ユーザーは他のユーザーからの「好意」を受け取ります。ここでいう好意とは、ジョブマッチングのケースでは企業から求職者へのスカウトであったり、求職者から企業への応募にあたります。ユーザーは受け取った好意すべてに対応できるわけではなく、ユーザーのリソースの上限（＝キャパシティ）の範囲内で対応することになります。例えば求職者が100社からスカウトを受け取ったとしても、すべての企業と面談をするのは現実的でなく、実際に面談できるのはせいぜい数十社程度でしょう。

相互推薦を行う上でユーザーのキャパシティを考慮することは、ユーザーの体験悪化を防いだりプラットフォーム全体での利益を最大化するという観点で重要です。この特徴に起因する技術的課題や研究動向は、後続の「推薦が偏る問題への対処」の章でより詳細に紹介します。

受動的なユーザーの存在

一般的な推薦システムが扱うサービスでは、ユーザーはサービスを利用する目的を達成するために、購買やコンテンツ視聴といった行動を能動的にとる傾向があります。一方で相互推薦システムが扱うマッチングのサービスにおいては、能動的に行動を起こすユーザーもいれば、相手からの好意が来るのを待つ受動的なユーザーもいます。

受動的なユーザーは適切なユーザーに発見されてそのユーザーから好意を受け取らない限り、マッチングなどのサービス利用の目的を達成することができません。受動的なユーザーの存在を考慮した上で、行動ログが溜まりにくい受動的なユーザーの嗜好をいかに捉えるかを工夫したり、適切な推薦のアーキテクチャを検討したりすることが重要になります。

ユーザーが自身の情報を積極的に提示する

相互推薦システムでは、ユーザーは推薦を受け取る側になることもあれば、一般的な推薦システムにおけるアイテムのように推薦をされる側になることもあります。この特性によりユーザーは、自身が他のユーザーに認知され興味を持ってもらうために、プロフィールや自身の興味といった情報を積極的に提示する傾向があります。

ユーザーから明示的に提示される情報は、ユーザーの嗜好を推薦に取り入れて活用する上で有用です。ただしそれらの情報には、ユーザーが他のユーザーからより良く見られたいという思いから、事実とは異なる情報が含まれる可能性があることに注意が必要です。

マッチングという行動履歴の情報が手に入りにくい

相互推薦システムが適用されるドメインの特性上、ユーザーの行動特性という観点で一般的な推薦システムとは異なる点があります。例えばジョブマッチングのケースを考えると、求職者は転職という目的が達成されるとそのサービス内では二度と活動しない、または次にまた行動を起こすまで長い期間がかかる、ということが想像されます。このユーザーの行動特性は、複数の商品を何度も買うような e コマースにおける推薦システムで扱うものとは全く異なるものとなります。

ユーザーの行動履歴はユーザーの嗜好を暗黙的に表現する情報として推薦に活用することが可能です。しかし相互推薦システムにおいては、そのような行動履歴の情報が手に入りにくい（＝スパース性がある）ということを考慮した上で設計を行う必要があります。このトピックに関する技術的課題や研究動向については、後続の「マッチングのスパース性への対処」の章でより詳細に紹介します。

相互推薦システムの技術的課題と研究動向

ここからは相互推薦システムが抱える技術的課題と、それらの課題に対して近年の研究ではどのようなアプローチが取られているか？を紹介します。

嗜好の集約方法

相互推薦システムのアーキテクチャの章で紹介した通り、相互推薦システムのアーキテクチャには各方向の嗜好予測の結果を集約するコンポーネントがあります。このコンポーネントによって、それぞれの嗜好予測の結果を融合し、相互の嗜好のマッチ度合いを示す単一のスコアを生成します。それぞれの嗜好を如何に集約するかは自明ではなく、様々な方法が考えられます。

以下の表は、Palomares et al. (2021)で紹介されている、相互推薦に関する研究で取られているアプローチがまとめられた表を抜粋したものです。各研究それぞれで様々なアプローチが取られているという現状がわかります。

Palomares et al. (2021) では集約を行う関数として、調和平均を選択することの合理性が述べられています。調和平均には片方のスコアが低い場合、集約したスコアも低くなるという特徴があります。比較として算術平均を考えると、算術平均は片方のスコアが低くてももう一方のスコアが高ければ、集約後のスコアは調和平均に比べ高く出ます。マッチングが成立するにはお互いがある程度十分な興味があることが必要と考えられるため、調和平均の持つ性質がマッチングという事象をより良く表現すると言えるケースがありそうです。実際に異なる集約関数で比較実験を行っている Neve and Palomares (2019) では、協調フィルタリングベースの相互推薦において、調和平均のパフォーマンスが算術平均を上回るという実験結果が得られています。

また、上記に挙げたような単一の集約関数を用いた方法以外のアプローチの例として、Kleinermann et al. (2018) は推薦を受ける側の嗜好と推薦される側の嗜好の重みを、ユーザーごとに最適化する手法を提案しています。

マッチングのスパース性への対処

次に紹介するのは、ユーザーの嗜好を表現するインタラクションデータがスパースであるという課題です。前述の相互推薦システムの特徴の章で触れた通り、相互推薦システムが適用されるマッチングというドメインでは、ユーザーがサービスを利用する目的（例えば転職や結婚など）が達成されるとサービスを離脱する傾向があります。この結果「ユーザーのマッチング」という嗜好を捉える上で重要な情報が得られづらく、嗜好の予測が難しいという課題があります。

この課題を解決するための一つの方向性として、インタラクションではなくコンテンツのデータを有効に活用することでユーザーの嗜好を読み取り推薦に活かすというものがあります。例えば Lai et al. (2024) では、知識グラフからメタパスを抽出しモデリングに用いることで、コンテンツの情報を組み込んで相互の嗜好予測を行うアプローチを提案しています。知識グラフとは仕事・求職者・スキルといったような異なるエンティティとそれらの関係をグラフとして表現したもので、メタパスとはグラフにおける特定の関係性（例：求職者が望む給料が、仕事が提示する給料を上回る）を表現するノードとエッジのパスを意味します。

この研究のポイントは、同一の知識グラフからそれぞれのメタパスを別々にモデリングしている点です。例えば「候補者は PhD を取得しており、学位以上を求める求人の募集要件を上回る」というメタパスを考えた場合、求人を出す側からするとその情報はポジティブな意味を持ちますが、候補者からすると自身のレベルに合わないというネガティブな意味を持つかもしれません。このように同じ知識グラフで表される関係であっても、候補者側と募集側とでその情報の持つ意味が変わるため、別々のメタパスとして分けてモデリングを行います。

さらにこの研究では学習に用いる損失関数に「マッチしたか否か？」という双方向の嗜好の情報だけでなく「求人に応募したが断られた」「候補者をスカウトしたが断られた」というような片方向の嗜好の情報を組み込むことで、限られたインタラクションデータを最大限に活用するアプローチをとっています。以上の工夫により、従来の相互推薦の手法と比較して高い精度を実現しています。

まとめ

この記事では、相互推薦システムの概要を説明した上で、相互推薦システムが抱える技術的課題とそれに対する研究の動向を紹介しました。ウォンテッドリーが開発する Wantedly Visit も同様の技術的課題を抱えているため、こうした研究の内容をインプットにしてより良いマッチングの実現に活かしていきたいです。

また、私たちと一緒に、推薦システムという技術活用を促進して人と会社の理想的なマッチングを追求するデータサイエンティスト・機械学習エンジニアの仲間を探しています。少しでも私たちの取り組みに興味を持っていただけたら、以下の募集から「話を聞きに行きたい」ボタンをクリックしてください！

引用文献

Akiva Kleinerman, Ariel Rosenfeld, Francesco Ricci, and Sarit Kraus. 2018. Optimally balancing receiver and recommended users' importance in reciprocal recommender systems. In Proceedings of the 12th ACM Conference on Recommender Systems (RecSys '18). Association for Computing Machinery, New York, NY, USA, 131–139. https://doi.org/10.1145/3240323.3240349
Chen, Kuan-Ming and Hsieh, Yu-Wei and Lin, Ming‐Jen, Reducing Recommendation Inequality via Two-Sided Matching: A Field Experiment of Online Dating (October 12, 2021). Available at SSRN: https://ssrn.com/abstract=3718920 or http://dx.doi.org/10.2139/ssrn.3718920
James Neve and Ivan Palomares. 2019. Latent factor models and aggregation operators for collaborative filtering in reciprocal recommender systems. In Proceedings of the 13th ACM Conference on Recommender Systems (RecSys '19). Association for Computing Machinery, New York, NY, USA, 219–227. https://doi.org/10.1145/3298689.3347026
Joshua Akehurst, Irena Koprinska, Kalina Yacef, Luiz Pizzato, Judy Kay, and Tomasz Rej. 2011. CCR: a content-collaborative reciprocal recommender for online dating. In Proceedings of the Twenty-Second international joint conference on Artificial Intelligence - Volume Volume Three (IJCAI'11). AAAI Press, 2199–2204.
Lai, K.-H., Yang, Z.-R., Lai, P.-Y., Wang, C.-D., Guizani , M. ., & Chen, M. (2024). Knowledge-Aware Explainable Reciprocal Recommendation. Proceedings of the AAAI Conference on Artificial Intelligence, 38(8), 8636-8644. https://doi.org/10.1609/aaai.v38i8.28708
Luiz Pizzato, Tomek Rej, Thomas Chung, Irena Koprinska, and Judy Kay. 2010. RECON: a reciprocal recommender for online dating. In Proceedings of the fourth ACM conference on Recommender systems (RecSys '10). Association for Computing Machinery, New York, NY, USA, 207–214. https://doi.org/10.1145/1864708.1864747
Yoji Tomita, Riku Togashi, Yuriko Hashizume, and Naoto Ohsaka. 2023. Fast and Examination-agnostic Reciprocal Recommendation in Matching Markets. In Proceedings of the 17th ACM Conference on Recommender Systems (RecSys '23). Association for Computing Machinery, New York, NY, USA, 12–23. https://doi.org/10.1145/3604915.3608774
Yi Su, Magd Bayoumi, and Thorsten Joachims. 2022. Optimizing Rankings for Recommendation in Matching Markets. In Proceedings of the ACM Web Conference 2022 (WWW '22). Association for Computing Machinery, New York, NY, USA, 328–338. https://doi.org/10.1145/3485447.3511961
Iván Palomares, Carlos Porcel, Luiz Pizzato, Ido Guy, Enrique Herrera-Viedma, Reciprocal Recommender Systems: Analysis of state-of-art literature, challenges and opportunities towards social recommendation, Information Fusion, Volume 69, 2021, Pages 103-127, ISSN 1566-2535, https://doi.org/10.1016/j.inffus.2020.12.001.