なにをやっているのか
QA Engineと人間のクイズチャンピオンチームが対戦する様子 (NIPS 2017 @ Long Beach)
NEEL Challengeの表彰式 (WWW 2015 @ Florence)
■どんな会社か
Studio Ousiaは、自然言語処理を用いた”賢い”コンピュータを実現することをビジョンとして、技術開発を行うエンジニア集団です。自然言語処理における世界最先端の技術開発を行いながら、マーケットのニーズに合わせて、それらを迅速にアプリケーションやサービスとして提供することを目指しています。
開発している自然言語処理のシステムは、高い評価を受けており、グローバルなコンペティションで4回の優勝しているほか、2017年には、弊社が開発した質問応答システム (QA ENGINE) と全米クイズチャンピオンを含むクイズエキスパート6人が対決し、弊社システムが大差(465対200)で勝利しました。
強すぎて「会場がシーンと……」 クイズ王を圧倒した“早押しAI”の衝撃 (ITmedia)
http://www.itmedia.co.jp/news/articles/1802/28/news037.html
クイズ王たちを凌駕する早押しクイズAIはこう作る~PyData.Tokyo Meetup #18イベントレポート (CodeZine)
https://codezine.jp/article/detail/10865
また、人工知能の領域に積極的に投資を行っているSamsung Venture Investmentなどの株主から数億円の投資を受けています。
Watsonみたいにクイズにめっぽう強いQA Engineを開発したStudio Ousiaが1.5億円を追加調達 (TechCrunch Japan)
http://jp.techcrunch.com/2017/02/16/studio-ousia/
■求めている人材
技術開発から、ウェブアプリケーションの開発、デプロイまで、バックグラウンドの異なる少人数のチームで分担し、開発をしています。
自然言語処理や機械学習などに詳しい人から、こうした技術を用いて面白いアプリケーションを開発したい人、効率的なサーバサイドのデプロイに興味のある人まで、多彩なバックグラウンドの人を歓迎します。
■快適に働ける環境
弊社では、エンジニアが面白くかつ快適に働けるような環境作りに積極的に取り組んでいます。例えば、メンバーは週数回の出社を除いて、基本的にリモートで働いていて、成果は書いたコードや設計したアルゴリズムで評価されます。
また、業務時間の25%を自分の好きな研究や開発などのプロジェクトに割ける制度があり、この時間を使って、オープンソースプロジェクトへの参画、Kaggle等へのコンペティションへの参加、論文や書籍の執筆などが可能です。
■開発している製品
人間の質問に対して、最適な回答を返す製品である「QA Engine」や、自然言語処理を行うための基盤技術であるエンティティリンキングの製品「Semantic Kernel」をリリースしています。
また、これまでに開発してきた技術は、世界的に評価を得ています。具体的には、情報科学におけるトップ会議(NIPS, ACL, NAACL, WWW、WSDM)で行われたグローバルなコンペティションにて、四回の優勝と一回の準優勝をしているほか、国際的に権威ある論文誌やトップ会議などで成果を発表しています。詳しくは、下記URLを参照してください。
http://www.ousia.jp/research
また、2017年に行われた、弊社の質問応答システム(QA Engine)と全米クイズ王を含むクイズエキスパートチームが対戦した様子を、下記で見ることが出来ますので、ぜひご覧になってみてください。
Human-Computer Question Answering Match (YouTube):
https://www.youtube.com/watch?v=gNWU5TKaZ2Q
なぜやるのか
Studio Ousiaでは、自然言語処理の技術を用いて、世界中の様々な問題やニーズにエンジニアリングの力で挑んでいきたいと考えています。また、先端的な手法を迅速にアプリケーションとしてリリースしていくことで、様々な問題を他社には出来ない方法で解決することが出来ると考えています。
特に、自然言語処理技術は、会話型インターフェイスや、質問への自動応答など、人間がコンピュータを一歩進んだレベルで操作するのに不可欠であるものの、開発において専門性の必要な領域であり、技術開発から実用化までを機動力の高いチームで迅速に行うことが非常に重要であると考えています。
どうやっているのか
作業効率を最大化して、楽しく働けることをとにかく重視してます。
また、定期的に読書会や論文読み会を社内で行っています。
開発には主にPythonを用いており、多様なライブラリをうまく用いてなるべく効率的に開発を行っています。サーバサイドには一部のGPUサーバを除いて、基本的にAWSを用いています。
■主に使っているライブラリなど
機械学習/NLP系: PyTorch, LightGBM, scikit-learn, hyperopt, NumPy, SciPy, Gensim, marisa-trie, mwparserfromhell, Joblib
システム/ウェブ系: Flask, Ansible, Cython, Fabric, Gevent, MessagePack, SQLAlchemy, Alembic
研究開発においては、学術機関との連携も積極的に行っており、慶應義塾大学 (機械学習) や奈良先端科学技術大学院大学 (自然言語処理) との共同研究を実施し、開発成果を国際会議等で開催されているコンペティションで評価したり、論文誌や国際会議等で発表したりしています。
■最近のコンペティションでの成果
- 優勝: NIPS 2017 Human-Computer Question Answering Competition, Long Beach, CA, USA, 2017
- 準優勝: WSDM Cup 2017 Triple Scoring Task, Cambridge, UK, 2017
- 優勝: Shared Task in NAACL 2016 Workshop on Human-Computer QA, San Diego, CA, USA, 2016
- 優勝: Shared Task #1 in ACL 2015 Workshop on Noisy User-generated Text, Beijing, China, 2015
- 優勝: NEEL Challenge in WWW 2015 Workshop on Making Sense of Microposts (#Microposts 2015), Florence, Italy, 2015
詳しくは、こちらをご覧ください:
http://www.ousia.jp/ja/research