wantedly/recsys2020-challenge
Contribute to wantedly/recsys2020-challenge development by creating an account on GitHub.
https://github.com/wantedly/recsys2020-challenge
ウォンテッドリーでデータサイエンティストとして働いております松村です。現在は、Wantedly Visit におけるユーザと企業の理想のマッチングを実現するために推薦システムの改良や、データサイエンスを活用したプロダクト開発に責任を持つ Matching Squad のチームリーダーをしています。
このたび、社内のデータサイエンティストである、合田 (@jy_msc)、縣 (@agatan_)、松村 (@yu_ya4)でチームを組み取り組んできた RecSys Challenge 2020 というデータ分析コンペが終了しましたのでその結果を報告させていただきます。
なんと私たち「Team Wantedly」は3位に入賞することができました!🎉🎉 最終結果はこちらから確認できます。
3ヶ月という長い期間、基本的に平日の業務時間後や休日に取り組むスタイルでとても大変でしたが、このような結果を残すことができ大変嬉しいです。
今回のコンペティションにおける私たちの取り組みは、論文としてまとめて RecSys Challenge の Workshops で口頭発表する予定です。7/8 までに論文を提出する必要があるので頑張ります。。。ただ、きちんと執筆してアクセプトされれば、Wantedly としては初の論文という形でのアウトプットとなりますので大変誇らしいです。
また、ソースコードは以下のリポジトリで公開しております。
RecSys Challenge とは、推薦システムに関するトップカンファレンスである The ACM Recommender Systems conference (RecSys) で毎年開催されているデータ分析コンペティションです。2010年から開催されていて、今年の RecSys Challenge 2020 で11回目の開催となります。データ分析のコンペティションといえば、Kaggle が有名だと思いますが、このように学会に併設されたものもいくつか開催されており、RecSys Challenge はその1つとなります。
今回の RecSys Challenge 2020 は Twitter 社による運営で、コンペティションの内容も Twitter に関するものでした。具体的には、Twitter 内の特定のツイートへのユーザのエンゲージメント(Like, Reply, RT, 引用RT)の有無を予測するタスクです。詳しくは Twitter 社が公開しています論文 (Privacy-Preserving Recommender Systems Challenge on Twitter's Home Timeline) を参照ください。
タスク自体は Twitter というサービスそのものが馴染み深いものでもあるためにとっつきやすかったのですが、さすが Twitter というべきデータ量に苦しめられ続けました。ただ、普段の業務ではなかなか扱うことのない(扱えない)量のデータに対して分析したりモデリングできたのは大変いい経験になりました。GCP にたくさん課金しました。今回はこの辺の計算リソースに対して会社からサポートがあったために、コンペティションを戦い抜くことができましたので大変感謝しております。
また、実は私は去年デンマークのコペンハーゲンで開催された RecSys 2019 に参加しており、RecSys Challenge のセッションも生で聴講していました。このときはまさか自分たちがこのコンペティションで入賞することになるとは思ってもいませんでした。
また、RecSys 2019 への日本人参加者で協力して、論文読み会を Wantedly にて開催したりもしました。
2020年は9月にブラジルのリオデジャネイロでの開催予定でしたが、昨今の情勢により今年はオンラインでの開催予定です。本来ならばブラジルで今回の我々の成果を発表できるはずだったのにオンラインでの発表になるのは正直少し残念な気持ちがありますが、この大変な状況の中でも発表のチャンスをいただけることに、オーガナイザの皆様には感謝の念に堪えません。
とりあえずは論文の執筆を頑張ります。時間がなくてやばいです。
シゴトの話をしますと、私たちが開発しているビジネスSNS Wantedly はここ数年で大きく進化してきました。たくさんのユーザの皆様や企業の方々に利用していただいており、たくさんの運命の出会いを創出してきてきたものと信じております。一方で、まだまだ解くべき課題は山積みです。たとえば、昨今のエンジニアブームであったり、このコロナ禍などにより、人々がシゴトに対して求めるものや考え方が変化してきています。この状況下、従来のサービスのままでは十分な価値を提供しきれなくなってきているかもしれません。そして、そのような課題の中にはデータの力で解決し得るものもたくさんあると考えています。
私たちのミッションは、今回のコンペティションで発揮したようなデータサイエンス力を駆使してそのような課題を解決し、「シゴトでココロオドルひとをふやす」ことです。すべてのビジネスパーソンと企業の理想のマッチングを実現すべく、これからも実直に頑張っていきます。
また、今回のようにデータ分析コンペティションにも引き続き参加して結果を残していき、Wantedly のデータサイエンティストの力を世に広めていけたらなと思います。
Wantedly では前述の通り、まだまだデータの力で解決可能な課題がたくさん残っています。一方で、データサイエンスチームは発足から2年が経ちある程度の体制が整ってきたとはいえ、まだまだ仲間が足りません。私たちと一緒に「シゴトでココロオドルひとをふやす」ためにデータを駆使してサービスを成長させていただける、データサイエンティスト・機械学習エンジニア・データエンジニアなどの仲間を探しています。少しでも興味を持っていただけたら是非以下の募集から「話を聞きに行きたい」ボタンを押してください。Twitter の DM でも構いません。まずは私たちとカジュアルにお話しましょう!
私たちのチームの雰囲気については、少し前の記事ですが以下をご覧ください。