中山 恭輔
共通語彙基盤を利用したオープンデータ基盤構築
IPAから提供されているデータの用語、意味、構造を統合し、分析しやすいようにすることを目的とした共通語彙基盤を活用するため、表データやAPIのレスポンスを半自動的に共通語彙基盤に適用するための基盤構築を担当。 具体的にはデータに含まれるヘッダ(プロパティ)と共通語彙基盤の用語の概念的類似度をfasttextを利用して計算し、ヘッダに対応させる類似度順に共通語彙基盤の用語を類似度順に表示させ、データを共通語彙へ変換するサポートをする機能を実装。 共通語彙基盤は入れ子構造を含む構造化データであるため、NoSQLのMongoDBを採用した。 また、本基盤を利用したWebアプリの開発、本番環境インフラ構築を実施中