奈良先端科学技術大学院大学 / 情報科学専攻 自然言語処理学研究室
400万人が利用する会社訪問アプリ
株式会社レトリバ / YOSHINA事業部チーフリサーチャー
博士課程ではシソーラスによる文書分類を最終目標としたキーワード抽出の研究をしていました。 文書中に出現するキーワードの間の階層構造を捉えることで、 個々人が今欲しいと言語化できる情報にアクセスするのではなく、 物事を俯瞰して必要な情報を選択できることを目指しています。
- 個々人の偏見に抗える、知識を用いた、情報組織化 - 個々人の偏見を踏まえた、受容可能で俯瞰を可能にする情報推薦 - 技術がいかにして社会へと広がるかを理解すること
バックエンドエンジニア兼リサーチャーとして新製品の開発に取り組んでいます
バックエンドエンジニア兼リサーチャーとして、製品の機能開発に取り組んでいます
博士課程時代の研究の続きを行っています
シソーラスによる文書分類を目的とした固有表現抽出
既知の語句の出現文脈を用いて疑似データを作成し、その疑似データに基づくキーワード抽出を行う課題に取り組んだ。 Co-teachingと呼ばれるノイズ除去の手法を用いた。 まず文脈情報と語句内部の情報の二つに分けたキーワード検出器で互いに教え合うことでノイズを除去しようとした。しかし、文脈情報に基づくキーワード検出器の精度の低さがネックとなりうまく行かなかった。 次に生物科学ドメインと科学ドメインのそれぞれで学習された二つの事前学習モデルに基づきノイズ除去を試みた。このとき、精度の改善はみられたものの先行研究に匹敵するものとはならなかった。
述語項構造解析
奈良先端科学技術大学院大学 / 情報科学専攻 自然言語処理学研究室