はじめまして。
あえて説明しませんが、タイトルでピンときた方はきっと市場でレアキャラと呼ばれる元同業か同類です、おめでとうございます!
「?」 と思った方はググってみると…やっぱりよくわからないかもしれません。うん、そんなものです。
2017年6月より、GROOVE Xというロボット開発のスタートアップで音声認識エンジニアをやっております、遠藤と申します。
世界的に活躍していらっしゃる諸先輩方に比べますと、ひよっこもいいところで、実のところ「音声認識エンジニア」と名乗ることすら恐れ多かったり…。
大変僭越ながら、入社に至るまでのお話を少しさせていただければと思います。
学生時代(音声認識に手を出してしまうまで)
昨今、界隈では buzzword 化してしまってはいますが、幼い頃から「AI(人工知能)」というものに心惹かれておりました。
漠然と、「友達とか自分の手で作りたい!」と思っていたわけですね。
それ故、工学の道を志しまして、まずは高専という男の園の道へ。
電気工学科なのになぜかプログラミングの楽しさに目覚め、自然とソフトウェア・エンジニアへの道も意識するように。
ただ、幸いにしてか不幸にしてか、「友達を作りたい」、という想いは全く変わっていませんでした。
転機は大学でした。
少しずつ視野が広がるにしたがって、凡人の私は段々と身の程を知り始めます。
「…全部自分で作るの…無理くね?」
…悩みました。
ただ…せめて…せめて…その一端には関わりたいなぁ…
↓
じゃあどうしよう? そもそも、自分が「友達」に期待してるのって、なんだっけ?
↓
テキストを打ち込んで伝えるんじゃなくて、やっぱり話しかけたいよね。そのときにはちゃんと反応してもらいたいよね。
↓
理解して返答することは難しくても、「話しかけて」、「それを正確に文字にできたら」、あとは言語屋さんとかがなんとかしてくれるかも?
↓
じゃあ、まずは「耳」作ろう!
なんかそんな、よくわからないロジックで、音声認識に手を出しちゃいました。
学生時代(音声認識に手を出しちゃってから)
音声認識の研究をしている研究室に無事潜り込み、
与えられた研究(開発?)課題が「研究室の独自方式を採用したリアルタイム音声認識エンジンを作る」というものでした。
条件は、「認識処理過程にOSSを一切使わないこと」。
大変喜ばしいことに、「音声認識エンジンをフルスクラッチする」という素敵な機会に恵まれたわけです。
…今思えば、右も左も全然わからないひよっこに、よく任せてくれたものかと…
おかげさまで、楽しい楽しい、週5泊まり込みのラボ充※ 生活を過ごすことができました。
※ラボ充:研究室生活 が充実している人、また、その様。後輩からはたまに仙人とか呼ばれる。
卒業までには入力から認識結果出力までリアルタイム動作するところまで一貫して実装し、
また、修了までには、他の音声認識エンジンとの比較や、新認識アルゴリズムの実証実験が回るレベルには到達できました。
正直、今思えばかなりの荒削りで、研究的にも大きな優位性を示すことはできませんでしたが、
リアルタイム動作する独自エンジンをフルスクラッチしたところはご評価いただけたようで、学会ではちょっとした賞をいただけました。
このあたりでおおよそ、音声認識で食べていく覚悟が整った気がいたします。
道を作ってくださった先生方には感謝に堪えません。また、今でも大変お世話になっております。
社会人(GROOVE X に誘われるまで)
「音声認識に関わる仕事をしていきたいなー」と思っておりましたので、これを事業としている会社を探していました。
業界が非常に限られてしまって、特定がえらく簡単なのですが、結局は某研究所を頂きとする、研究系子会社に採用していただけました。
仕事の内容も先端かつチャレンジング、関わる領域もPoCレベルから、市場に出るプロダクトの上流〜下流まで様々、上司・先輩・同僚・後輩にも恵まれ。「天職だ!」と公言していたくらい、大変素敵な会社でした。
多忙でありつつも日々技術を磨き、楽しく過ごしていた折、友人女性(大学同期)のご家庭に遊びに行く機会がありました。
旦那さんに現職の説明と、音声認識について熱く語っておりましたら、なんと旦那さんがGROOVE Xのハードウェア・エンジニアだったわけでして。
お誘い頂きましたが、その時は一度断らせていただきました。まだやり残した、行く末が見たい担当案件が色々あったのですね。
ただ、「GROOVE Xの会社・社員紹介がある」と再度お誘いを受け、ほいほいついて行ってしまったのが、大きなきっかけになりました。
GROOVE★Night for Groovers #001
会社紹介や、働く社員さんのご紹介、および交流会でした。…もう最近はやっていないかな?
会社紹介は、正直申し上げますと「うーん…デザインも詳細も非公開だし…謎が深くてよく分からない…」という感想でした。
しかし、私にとって衝撃的だったのは、GROOVE Xで働く社員さんのご紹介でした。
「未経験なロボット開発エンジニアに転身した超業界経験豊富なソフトウェア・エンジニアさん」
「宇宙開発からロボット開発に挑戦の場所を変えたエンジニアさん」
「動物ロボットを作りたいという夢を追いかけてここまできた強化学習の研究者さん」
「おもちゃ業界の変形ロボットデザインから、本物のロボットデザインへと活躍の場を移したデザイン・エンジニアさん」
「多様なアートをソフトウェアを使って昇華させてきたアート・エンジニアさん」
「ロボットの”カワイイ”を統括する、3Dアニメーターかつ元ダンサーさん」
なんて尖った人たちなんだ!
こんな凄まじく多様な人たちを擁する GROOVE X という謎な会社にワクワクしてしまったのと同時に、元々、「耳」を「自分で」作りたかったという気持ちが大きく膨らんでしまいました。
こんな尖った人たちのパワーを集まったら、何が生まれるかを見てみたい。
ここでなら、更に自分も尖れるし、やりたかったことももっと存分にできるに違いない。
そんなこんな思っておりましたら、気がついたら私も…という流れです。
GROOVE X に入社してみて
「音声認識エンジニア」と書いてしまっているのである程度はバレバレですが、音声認識や周辺技術に関わるアレコレを色々面でアレコレしております。
詳しいアレコレは、残念ながら機密に直接関わるため、申し上げることができません。
プロダクトが世に出るまでお待ちいただくか、お仲間になっていただければよく分かるかと思います。
あとは、タイトルの一部にもなっている「音素バランス文」を画面を見ながら突然ブツブツとつぶやき出すため、新しく入社された方には、「ちょっとおかしくなった人」か、「魔術師かなんか」と思われることが茶飯事です。
私は元気です。
私が思う GROOVE X という会社の面白いところは、やはり、入社前に思ったとおりの多様性(尖った人ばっかりいるの)と、代表取締役以外役職がなく、全員フラット、というところですね。
社員各々の得意分野の分散が大きく、また高いレベルにもあるので、その組み合わせによって新たな気付きや、解決方法が見いだせることが本当に多いです。
また、フラットな組織であることが、それに拍車をかけていると思っています。
それぞれが高い自主性と目的を持って独立に動けることが前提にはなりますが、基本的な垣根がないためフットワークが大変軽いです。
チームは大きく分けてハードウェア、ソフトウェア、カワイイ(LOVOTを思わず抱きしめたくなるような振舞いを開発するチーム)、ビジネスとありますが、ロボット開発が関わる領域は大変広いです。
それぞれの領域にまたがる課題も当然出てきます。
そういうとき、すぐにチームを超えて相談することによって、より最適な方法を模索することが可能です。これは、プロダクトを作る上でとても大きな利点だと思っています。
ホワイトボードと付箋が至るところにあり、しょっちゅうどこかで予定にない議論が勃発しているのも、弊社の特徴かもしれませんね。
むすびに
拙文ではございましたが、弊社を知る機会の一端としてお役立ちできたのであれば、幸いでございます。
ロボットにちゃんと音声認識載せてやるぜ!という奇特な方はもちろんのこと、
それ以外の領域の方もガンガン募集しています。
もしご興味を持っていただけましたら、中の人とカジュアルにお話することもできますので、
まずはぜひ、軽い気持ちでお話を聞きに来てください!