こんにちは!株式会社キスモのKaggler 大越です。
今回は【取締役大越が語る】シリーズvol.1です!
記念すべきvol.1では、今の仕事につくまでのヒストリーとキスモの業務内容、創業当初の苦労話等を語っていきたいと思います。
では早速プロフィールからです。
プロフィール
大越拓実
1995年、神奈川県出身、名古屋大学卒。大学で統計学、機械学習を専攻。第14回キャンパスベンチャーグランプリ中部大会で名古屋産業人クラブ会長賞を受賞したほか、Startup Weekendでの優勝経験を持つ。 創業前はデータサイエンティストとしてのレコメンドエンジン開発やスポーツにおけるデータ活用に従事。Googleが運営するデータサイエンスの世界的なコンテストのKaggleではKaggle expertの称号を持つ。
ヒストリー
小学生の時に野球をやっていて、自分の打撃成績や投手成績をエクセルでまとめていました!
そのデータを眺めるのが好きだったのが、データ分析を始めたはじまりだったなあという感じです。
毎朝、新聞でプロ野球の選手成績を眺めるのも日課でしたね。
その後、高校生ではセイバーメトリクスという野球統計学の分野にはまり、日本プロ野球にセイバーメトリクスを導入したらどのような選手が評価が高いか、各チームどの選手をレギュラーにすると強くなるか、日本代表を作るならどの選手を集めるべきかなどをまとめていました。
高校生としては特殊なことをやっていると感じるかもしれませんが、自分の高校ではこのような研究活動の時間が与えられていて、その時間を使って研究を進めました。
【当時提案した、指標的に理想の広島カープ打線のまとめです。】
大学でも統計学を勉強したいと思っていて、いつの間にか統計学、機械学習を仕事とするようになっていました。
最近では、KaggleというGoogleが運営する機械学習のコンテストサイトで様々なコンテストに参加し、世界の強者達と闘う遊びにはまっています。
機械学習をやっている人、やりたい人はとりあえずKaggleのコンテストにsubmitしてね!
あとキスモに興味を持ってくれると嬉しいです!
キスモでの業務内容
キスモではデータエンジニアという名前で働いていますが、機械学習エンジニア、データサイエンティストのような業務をしています。
ここら辺の命名はいろいろ議論されていますが、正直なんでもいいと思っています笑
機械学習エンジニアは主に1人で複数の案件の開発を行なっています。
案件によって開発体制は変わりますが、現在は
- 機械学習エンジニア(実験、API作成、報告書作成担当)
- Webエンジニア(フロントの開発と納品担当)
- インフラエンジニア(開発環境の整備と納品担当)
- マネージャー(コンサルみたいな感じのこと)
というのが主です。
機械学習エンジニアの業務内容を細かく見てみましょう。
- 実験
主にKaggleみたいなことをしていますが、プラスで、データを分析できる形にするという工程が必要です。
エクセルに貼り付けてある画像を分析したこともあり、そのままでは画像を読み込めないので、その時は1つずつ手動で画像の保存し直しもしました笑 - API作成
pythonのスクリプトを納品する場合は、納品スクリプトを作成します。
Web開発が必要な場合は、Webエンジニアが使えるようにAPIという形でスクリプトをまとめます。 - 報告書作成
実験のアプローチや結果、参考論文などを掲載した報告書を作成します。
以上がざっと機械学習エンジニアの業務内容です。
あとは、どのような進め方を取るべきかや、報告書の内容説明のために相手企業とミーティングに参加することもあります。ミーティングはオンラインの時や直接伺う時もありますが、自分はリモートで働いているので、オンラインが多い気がします。
これまでの案件の中で画像、動画、テキスト、数値データ、時系列データと音声以外の様々なデータを扱ってきました。そんな風に実ビジネスの世界で色々なデータを分析できて、それでお金を稼いでいると実感できるところが楽しさだと感じています。
また、社内で機械学習をよりシンプルに実験できるような開発も行なっていて、これがまたとても楽しいです!Kaggle等で得た知見を取り入れて、社内の人がより簡単に機械学習の実験を回せるような環境を作っています!いかにしてシンプルな構図に落とし込むか。どうしたら多くの人が使えるような簡単なものができるか。日々試行錯誤ですね。
こういった話に興味があれば、ぜひご連絡ください!
絶賛機械学習エンジニア募集中です。ちなみに、リモートワークもOKです!
創業当初の話
現在でこそデータエンジニアとして働いていますが、自分は立ち上げメンバーなので創業からこれまで、本当に様々な仕事をしてきました。
- コンサルティング
- 営業
- 社外の人とのミーティング
- リサーチ
- 機械学習系の開発
- データ収集、作成
- 手動アノテーション
- フロント部分の開発
- レポート作成
- 納品
- 環境構築
- 講演
- 機械学習の講師
- 企業運営
- マネジメント
- 現場見学
まだまだありそうですが、これらを大学4年生のうちに経験できたことはとても貴重だったと思います。
この中で圧倒的に自分に向かないなと感じたのは、現場見学と営業です笑
そもそもデータは好きだけど、人と話すのは得意ではないので、営業での話せなさは異常でした笑
契約に結びつけるために、相手の課題を引き出すとか難しすぎです。
現場見学も行くものの、そこからここは変えられそう!という課題の抽出が難しく、何も提案できませんでした。
あとは、環境構築なんかも好き嫌いは分かれる部分ではないでしょうか。それこそ当初は試行錯誤しながら色々していましたが、今ではインフラエンジニアがいるので安心して任せられるようになりました。開発に集中できるので、とても助かっています!
【創業から1ヶ月経ち、最初のオフィスでの写真です。株式会社Misocaから豊吉さん(左上)、奥村さん(右上)が遊びに来てくださった時です。】
創業当初の思い出深いエピソードは、夜中まで鬼のように働いたことですね笑
そもそもプログラミングを始めてから起業するまで4ヶ月だったので、本当に右も左もわかりませんでした。今と比べて仕事さばきが遅かったり、どれくらいの期間がかかるかの見積もりが甘かったりで、苦労しました。
しかも納期は待ってくれないので、1番大変だった時は開発が遅れて夜中の2時3時まで開発、次の日の朝6時からまた開発なんてこともありました。大学では部活もやっていたので、夜遅くまで開発して、次の日も朝早くから仕事して、夕方に部活も参加するとか普通でしたね笑
今となっては信じられない〜
特に印象に残っているのは10個近くのDNNモデルを作り、それらと画像処理の技術などを組み合わせて1つのサービスを作る案件ですね。
学習がうまくいかない原因がわからず、何日も試行錯誤に費やしたり、物体認識のタスクなのにデータがなくて手動アノテーションを何百枚もしたり大変でした。主に2人で開発していたのですが、相方もプログラミング歴が短く、コードのバグの原因がわからず何日も費やしていて、苦労していました。
とにかく最初に立てた予定表からできるだけ遅れないよう遅れないよう、必死でやっていました。しかも、たいがいの案件で発生するのですが、途中でアプローチが変わり、その対応も入ってくるんです。ああ忙しい!
そんなこんなでやっていたのですが、さらに追い討ちをかけたのが、相方が大学院の授業忙しい問題ですね。納品前に全タスクが自分1人に降りかかってきました。
絶望しました。
案件が複雑化しすぎて、他のメンバーがコードを理解するのに時間がかかりすぎるため、自分でやるしかありませんでした。10個近くのDNNモデル、画像処理、前処理等の膨大なスクリプトを結合して、テストして、高速化してと納品前日までフル稼働しました。もちろん細かいバグやエラーが延々に出てくるのでその修正も。
唯一の救いとしては、この案件をメインに進めていた会社の方が、納品作業のサポートに回ってくださったことですね。夜中の1時2時までslackで連絡をとりながら作業して、次の日の朝6時7時に再開してました。
休日には、採用を兼ねてエンジニアのイベントに参加しながら、その場で並行して納品作業を進めていたを覚えています笑
何とかやり遂げたわけですが、終わった時は本当に休みたい以外の感情はなかったですね。
ですが、納品を手伝ってくださった方のおかげで特にpythonのエンジニアリングの知識が身につき、今となっては面白い昔話にもなり、まあ辛かったけどよかったのかなあと。
が、やっぱり生活にはゆとりがないとダメですね。今はだいぶゆとりを持った生活ができています!
vol.2でもお話ししますが、業務時間は短いですし、残業も全くなし。
就職した大学の同期に「うらやましすぎる!」と言われています笑
これもあの頃の頑張りがあり、今までの勉強があって実現しているわけですが、とにかく今は恵まれた環境で仕事ができていて、とても楽しいです!あー、やりがいや楽しさもこの勢いで書きたい!と思いますが、vol.2で書くように言われているのでこの辺で。
改めて言っておきますが、
今の弊社は機械学習エンジニアにとってはめちゃくちゃ楽しい環境です。
vol.2も読んで、おお面白そう!と思っていただければ嬉しいです、ぜひ応募もしちゃってください!
では、vol.2でまたお会いしましょう!
株式会社MEBAISでは一緒に働く仲間を募集しています