YouTube動画視聴回数予測コンペ11位
ProbSpace主催「YouTube動画視聴回数予測」に内定者とチームを組み参加。public10位, private11位という結果を残した。 ※参加ユーザー数: 448, スコア提出者:225 与えられたデータは動画コンテンツの質的指標となるlike/dislike・コメント数や、タイトル名・説明文・タグ・投稿時間といった情報が含まれていた。サムネイル画像も取得することができ、テーブル×text×画像といったマルチモーダルなデータが利用できるコンペであった。 担当したのは特徴量作成からLightgbmでのモデリングの全領域。NLPの研究をしている内定者にはNLPの特徴量作成に関してアドバイスをもらった。動画の説明文には記号やリンクなど多くの前処理が必要であった。自分にとってNLPを扱う初めてのコンペであったが、ti-idfなど今後使えるテクニックを習得したコンペとなった。 ブログ:ProbSpace YouTube動画視聴回数予測コンペに参加した(https://masanori.hateblo.jp/entry/2020/06/30/172845)