400万人が利用する会社訪問アプリ

  • 機械学習エンジニア
  • 20エントリー

音声・言語・画像を処理できる機械学習エンジニアを全方位にWanted

機械学習エンジニア
中途
20エントリー

on 2023/12/01

587 views

20人がエントリー中

音声・言語・画像を処理できる機械学習エンジニアを全方位にWanted

オンライン面談OK
東京
中途
東京
中途

相川 直視

Rimoの代表社員兼エンジニア。早稲田大学の学生時代は検索/自然言語処理の研究に従事し、北京のMicrosoft Researchでのインターンを経験。2011年にGoogleに新卒入社し、検索システムの開発に従事。2012年にWantedlyの開発に参画しランキング、課金システム、インフラ基盤の開発をリード。2016年8月よりWantedly Peopleアプリの開発リーダー。2019年10月よりRimo合同会社創設。

滝川 真弘

エンジニアやってます 学生の頃思っていたこと↓ 将来の夢は超お金持ちになること。超お金持ちになって農業工場(植物工場)か振動発電に投資すること。全額還ってこなくてもいいからがんばってくださいって言って大金ぽんと出せるくらいの超お金持ちになりたい。もし自分が超お金持ちになる前にどっちもメジャーになってきたら他の「できたらすごいけど採算がとれないから発展しない」分野に投資したい。

高瀬 理奈

デザイナーと近いところで体験を議論したりしながらプロダクトを作っていくのが好きです。

西谷 歩

にしやあゆみ、略してにしゃみです。19年卒の新卒デザイナーとして Wantedly に入社しました。Wantedly の新しいユーザ体験を創るため、ユーザインタビューを始め実験的なUXコンセプト設計、UIデザイン、コンセプト検証などを行っています。直近の課題だけでなく、未来を見据えた "意味のイノベーション" をしていくこと、それを形にする仕事にココロオドル デザイナーです

Rimo合同会社のメンバー

Rimoの代表社員兼エンジニア。早稲田大学の学生時代は検索/自然言語処理の研究に従事し、北京のMicrosoft Researchでのインターンを経験。2011年にGoogleに新卒入社し、検索システムの開発に従事。2012年にWantedlyの開発に参画しランキング、課金システム、インフラ基盤の開発をリード。2016年8月よりWantedly Peopleアプリの開発リーダー。2019年10月よりRimo合同会社創設。

なにをやっているのか

Rimo Voiceは動画をアップロードし、文字起こし、話者分離、議事録作成をするサービスです。今後はこのデータをもとに、人事評価や経営判断までAIができるようにすることも目指しています。 この領域はつまり、音声認識や言語処理で、GoogleやMicrosoftが扱っている領域を真っ向勝負しているプロダクトともいうことができるかと思います。UI/UXでGoogle MeetやDocs / Teams などと差別化するのももちろんですが、その本質はやはり機械学習にあり、日本語領域においてはそれらのサービスに引けをとらない精度が必要だと思っています。 実際に、精度面では日本語においてGoogleのAPIなども凌駕できており、それがサービスの拡大につながっていますが、WhisperやChatGPTなどが出てきている今、あぐらをかいている場合ではない認識です。 代表の相川は、昔 Microsoft Researchのインターンなども行き、研究も好きでしたが、データがないと始まらない部分や、大学ではメインストリートの研究では論文が書けず、結局重箱の隅をつつくような研究をするしかないことが辛いなと思ってエンジニアリングの道に進み、Googleやベンチャーで経験を積み、今この領域でチャレンジを始めました。 この領域で一緒にチャレンジしてくれる機械学習エンジニアを求めています。

なにをやっているのか

Rimo Voiceは動画をアップロードし、文字起こし、話者分離、議事録作成をするサービスです。今後はこのデータをもとに、人事評価や経営判断までAIができるようにすることも目指しています。 この領域はつまり、音声認識や言語処理で、GoogleやMicrosoftが扱っている領域を真っ向勝負しているプロダクトともいうことができるかと思います。UI/UXでGoogle MeetやDocs / Teams などと差別化するのももちろんですが、その本質はやはり機械学習にあり、日本語領域においてはそれらのサービスに引けをとらない精度が必要だと思っています。 実際に、精度面では日本語においてGoogleのAPIなども凌駕できており、それがサービスの拡大につながっていますが、WhisperやChatGPTなどが出てきている今、あぐらをかいている場合ではない認識です。 代表の相川は、昔 Microsoft Researchのインターンなども行き、研究も好きでしたが、データがないと始まらない部分や、大学ではメインストリートの研究では論文が書けず、結局重箱の隅をつつくような研究をするしかないことが辛いなと思ってエンジニアリングの道に進み、Googleやベンチャーで経験を積み、今この領域でチャレンジを始めました。 この領域で一緒にチャレンジしてくれる機械学習エンジニアを求めています。

なぜやるのか

Rimoは「はたらくを未来に」を企業理念として活動しています。 大人になると人生の中で大部分の時間を占める「はたらく」時間をより良いものにすれば、より幸せな人が増えるはずだと考えています。 より新しい概念の働き方は、既に広まってきているもので言えば、副業/複業やリモートワークが可能なこと。もう少し新しいものだと、週4日勤務の正社員や、自律分散組織(DAO)、給料を完全公開することによる経営戦略に全員がアクセス可能なことなどが挙げられます。AIが発展することにより、ベーシックインカムが実現しもしかしたら労働がラグジュアリーなものになる可能性すらあります。 Rimoの「未来に」という言葉は5年後10年後においてもより新しい働き方でその時代にあったより良い働き方を、自らの企業もしていくし、それをサポートするようなサービス群を提供し続けようと思っています。 Rimoが現在メインで取り組んでいる「議事録」領域は会社の仕事の流れ全てが「言葉」で集まってくるところなので、それをしっかり集めて整理し解析することで、将来はAIの補助により良い経営戦略や、働き方によらないより公平な評価を実現することもできるようになると考えています。 なので、今はまずしっかり会議の中身を理解し、的を射た議事録を作ることにフォーカスし事業を進めています。

どうやっているのか

「はたらくを未来に」を体現するように、 より未来に、普通に良いとされるはたらき方を模索しています。 ただどんな制度でも採用してみようとすると訳がわからなくなり組織崩壊してしまうので、以下の3つの基準を設けて企業文化として取り入れる制度を考え日々進化させています。 ■ 1. Fair exception: 意味のない平等をなくした公平な組織であろう 「全員平日5日9時から5時で出社」平等ですね。でも、職種や役職、人生のフェーズ(仕事バリバリやりたい/子育てもしっかりしたいetc.)は違うのに本当にそれでいいのでしょうか?給与だってみんな違う訳だから、お互いに迷惑がかかりすぎない範囲で、それぞれに合った働き方ができた方がいいはずです。それを模索していきます。(e.g. 週3勤務、奥さんの休みに合わせ休日を自由に移動可能) プロダクトにおいても、基本は一つの製品だけれども、業界や利用用途によってしっかりカスタマイズされたようなものを目指します。 ■ 2. Go for excellence: いまは優秀でなくとも、優秀であろうとしよう 抜きん出た存在よりも、いまいる人たちを大切にしながら、一緒に心地よく高みを目指します。 競争の激しいAIベンチャー領域だからこそ、どんどん働かせて、どんどん高い給与でよりできる人を採用して元いた人を食い潰していくみたいなことは起きないようにしつつ、ちゃんと会社が成長するようにそれぞれが成長できるような組織を目指します。 ■ 3. Care yourself: まずは自分を大切にしよう まずはそれぞれが自分を大切にし、次に自分に近しい人を大事にする。 それが満たされているからこそ、その延長線上に、良い組織が生まれ、良いプロダクトが作れ、お客様の成功を心から考えられるようになると信じています。

こんなことやります

RimoはInputが動画という特性上、音声・言語・画像のどれを処理できる機械学習エンジニアで全方位で求めています。具体的には以下のような業務がありますが、この先作りたくて公開できないものも多いので、これだけにとどまりません。 - [音声認識] 文字起こし、話者分離 - 最近はWhisperのファインチューニングがメインテーマになっています。 - Facebook(Meta)なども良いものを出してきているので別の方法でもいいです。 - 話者分離も、高速で、精度が良く、事前の声紋があるときにも使え、ないときにも使えるなどの条件を全て満たすものがなかなかなく、この領域も鋭意探索中です。 - [言語処理] 要約/議事録生成 - ここはWritingだと記事生成、商談だとSalesForceに入力する項目を自動抽出など応用により変化します。 - ここはChatGPT等を利用できるため、プロンプトエンジニアリングも重要です。 - ローカルLLMを利用することもできますが、費用対効果が現状薄そうなので現状そこまで手を出さない判断です。今後この判断は覆ることがあり得ます。 - 要約や抽出箇所のオリジナルの場所を特定する必要があるため、そこは自前で行っています - ToDoの抽出などではChatGPTの処理の後に、誰がいつまでにやるべきかなどをさらに推論しより精度を上げる必要がありそうです - [画像認識] 動画からの情報抽出 - 資料を共有しているところを見つけ出してその中身も議事録に反映させる - 顔認識を通じて、動画からの話者分離 ## 求める人物像 要件としては、Kagglerでも大学の助教授や、企業の研究所の方、MLエンジニアでも大丈夫です。 ただし、Rimoは調達なしで売上から皆の給与を出し、一人当たり給与を上げようと努力している組織なことは頭に入れておいてください。現状、サーバー代を莫大に使い、成果が1年以内に出るかわからないものには投資できないです。 それを分かった上で、まずは1ヶ月で実装方針が立つものから始め、3-6ヶ月で身を結ぶものをユーザーに届けていくことを楽しめる人が向いているかと思います。 また、副業で働いてくれている人で論文を何本も国際学会に通してICPCなどでも世界大会経験のある人がいるため、機械学習の知識はないけれど、実装力には自信があって色々実験できますという人でも大丈夫です。 ## 必須スキル - 求める人物像に書いた内容に当てはまっていること ## 歓迎スキル - タスクをKaggleのように整理でき、データセットを準備し解ける問題にできる - コードを高速にできる限りバグを出さずに書くノウハウを持っている - 特定のタスクが与えられたとき、そのデータセット、論文、実装済みコードを探せる - 採用候補者のいるような学会の論文を書き、スポンサードし、Rimoの代表として学会に参加できる ## この仕事の魅力 - 機械学習の内容自体が面白い。 - 音声認識×GPTという世の中のトレンドを捉えたサービスであることから、利用者を飛躍的に向上させるチャンスがある。現在も契約者数が急増中。 - 世界展開を計画しており、プロダクトを日本だけではなく世界に広げて行ける。 ## 開発環境 言語:Python, Go, TypeScript フレームワーク:pytorch, fastAPI, sklearn, openai api, LangChain, gin, React(Next.js), データベース:Firestore(Firebase), BiqQuery ソースコード管理:GitHub 情報共有ツール:Slack, Zoom, Notion, Rimo インフラ:GCP(Kubernetes Engine, Cloud Run)
3人がこの募集を応援しています

メンバーの性格タイプ

西谷 歩デザイナー
西谷 歩デザイナー

一緒に働くメンバーの性格タイプをチェックしよう

Wantedlyの性格診断では16パターンからなる性格タイプと、具体的な個人傾向を見ることができます。

性格診断とは

3人がこの募集を応援しています

話を聞きに行くステップ

  1. 応募する「話を聞きに行きたい」から応募
  2. 会社からの返信を待つ
  3. 話す日程を決める
  4. 話を聞きに行く
募集の特徴
オンライン面談OK

会社情報

2019/10に設立

17人のメンバー

東京都渋谷区渋谷2-24-12 渋谷スクランブルスクエア 39F