【現状の課題】
私たちが目指すのは、Web上のあらゆるビジネス情報を再整理し、ビジネスシーンでのデータ活用業務を自然言語処理AIで総置換することです。そのために、世界中のニュース、企業情報、論文、特許などをWebから収集、抽出、加工して顧客に提供し、企業の製品化・事業化を加速させられるような「オープンデータリサーチサービス」を開発しています。
しかし、顧客が「欲しい情報」を配信するための機械学習モデルやアルゴリズムの設計において以下のような複数の課題を抱えています。
・配信コンテンツ決定処理(text-preprocessing, deduplication, filtering, classification, etc)の精度の問題で、顧客が本当に欲しい記事を配信できずUXを下げている
・利用率向上に寄与しうるデータ拡充や精度向上施策を決めづらい
・機械学習にフォーカスするチームのリーダーが不在
【業務内容】
シニア機械学習エンジニアとして組織をリードすることを期待しています。
・機械学習や自然言語処理を用いた配信パイプラインの検証・実装・運用
・顧客フィードバックと利用データをもとに配信精度の課題を探索し、精度向上やデータ拡充の施策につなげる
・顧客に配信するニュース,論文,特許,レポートといった情報ソースの拡充戦略の策定と実行
※変更の範囲:開発関連業務
【チーム構成】
Opendata Unit
・バックエンドエンジニア2名
・機械学習エンジニア2名
・DRE 2名
<構造化/PaaS事業チーム(別チームだが随時協業)>
・機械学習エンジニア2名
・MLOpsエンジニア1名
【開発環境】
[開発言語]
データ/機械学習パイプライン: Python
Webクローラー: TypeScript(Node.js)
[コンテナ]
Docker
[IaC]
Terraform
[クラウド]
AWS
【ポジションの魅力】
・数億件規模の配信データを対象とした機械学習パイプラインの開発と運用を経験できる
・Customer SuccessチームやSalesチームとコミュニケーションしながら、顧客の定性課題を直に体感しつつ改善策の提案・実行を経験できる
・ResearchチームのNLPプロフェッショナルと協業しながら機械学習モジュールの検証と実装フェーズを経験できる
【必須スキル】※すべて必須
・理工系大学院を修了
・5年以上のエンジニア経験
・機械学習を用いたサービス開発/運用経験
・AWSを用いたサービス開発/運用経験
・開発チームのリード経験
【歓迎スキル】
・コンピュータサイエンスに関連する技術分野の修士号または博士号
・顧客向け自社開発サービスの開発/運用経験
・AWSを用いた機械学習実験, モデル管理, データ管理, 学習・推論パイプライン構築の経験
・Terraformを用いた開発/運用経験
・リーダーなどの立場で事業背景を理解し自ら施策を立案/実行した経験
【求める人物像】
・コンピュータサイエンスが好き
・最新の理論や事例をフォロー、検証するのが好き
・与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
・ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
・前向きなチャレンジ精神
<その他>
・入社後、必要に応じて東京オフィスへの出社が可能な方
・開発に関する技術的な内容含め、日本語で円滑にコミュニケーション可能な方
目安:日常会話レベル
最後に
当社は、独自の自然言語処理AIを活用した、AI SaaSで日本企業の成長を後押しすることを目指していスタートアップです。2022年8月にシリーズCで11億の資金調達完了。2024年2月には、経済産業省およびNEDOが推進する「GENIAC(Generative AI Accelerator Challenge)プロジェクト」に採択され、2024年5月に1000億パラメーターの自社LLMを公開いたしました!
従業員も100名を超え、更なる成長を目指すために人員を募集しております!
リモートワークなど働きやすさも大事にしています。お気軽に「話を聞いてみたい」よりエントリーしてください!
【関連資料】
・Opendata Unitのご紹介
https://stockmark.wraptas.site/48e328c4d33a480f837a6509f575db8f