情報革命を終わらせるために ~なぜ独自LLMに取り組んでいるのか~
生成AIブームに対して思うところ
明けましておめでとうございます。株式会社Lightblue代表取締役の園田です。
今回、AIスタートアップLightblueを経営しているデータサイエンティストとして、近年の生成AIの盛り上がりと、2024年以降の動向についてのビジョンを書こうと思います。
まず、生成AIに関する盛り上がりは一時のブームなのでしょうか。
株式市場やSNSでの盛り上がりについては、僕は専門家ではないのでわかりませんが、
技術の観点ではファンダメンタルなものであると考えています。
産業革命が18世紀半ばから19世紀に起こったように、
1990年以降の情報革命が2023年の生成AIの普及で歴史的には一区切りとなるような出来事であるはずです。
インボイス制度でオフィスワークがなくなる?
2023年はインボイス制度や電子帳簿保存法の改正などバックオフィス業務での負荷が増えた1年でした。
そういった社会環境に対し、弊社では、社内体制を一新し、SaaSや外部リソースの活用を通し、
総務的な業務を行うアドミンスタッフを2名から0名に減らし、
財務・監査に関わる経営のコアなバックオフィス業務へのリソースの集中を進めています。
これまでは、外注の契約や請求書の印刷など不定期で柔らかい業務で、
ルーティーンとして定義することが難しい業務をなんとなく人に頼むという働き方でした。
それに対し、インボイス制度は請求書・領収書を受け取る際にインボイス番号の確認が必要になり、
タクシーに乗るにも、業務委託契約を結ぶにも、雑にアドミンスタッフに頼めない状況になっています。
そのほかの、社内イベントの企画などは、アジェンダについてはLLMに頼むことで、簡単に高品質なアウトプットが出るようになっています。
このように、10年後にはオフィスワークのほとんどはなくなるはずです。
アドミンスタッフの最大の価値は柔らかい指示を受けてくれることでした。
それに対し、LLMも柔らかい雑な指示を受けられるようになっています。
(もちろん、いまのLLMはまだまだ、Prompt-Engineeringのような工夫が必要ではありますが。)
情報革命が終わるとき
この、農業革命・産業革命に匹敵する革命期において、
ビジネスができることは非常にラッキーであると考えています。
また、労働生産人口が減り、人手不足の日本という地の利もあります。
データサイエンティスト・エンジニアっぽい話をします。
情報革命の中心にあるコンピュータですが、
「プロセッサ」「記憶装置」「入出力装置」で構成されます。
初期は、大量のデータを完全な状態で保存できる「記憶装置」としての価値が高い時代でした。
たとえば、現代の金融において、給与が手渡されることは稀ですし、通帳に入っているお金を全て現金で下ろすということはほとんどあり得ません。
記録されているデータだけです。
その後、ブロードバンド回線が普及し、「入出力装置」部分のスループットが大幅に向上し、
最近では映画や音楽をNetflixやSpotifyで楽しめるようになっています。
そして、いま、「プロセッサ」部分の性能向上により、生成AIが登場しました。
これによって、情報革命の中心にあるコンピュータを構成する3要素全ての性能を引き出せたと言えます。
これらの技術が普及し、ビジネスが変わり、人々の生活の質が向上することで情報革命が完了するはずです。
Lightblueはこの情報革命の完了を進める存在になりたいと考えています。
一方で、ワークフローとして現役で利用されているNotesの移行プロジェクトが話題になる大企業もまだまだいます。
(30代以下の方は「Notes」について初めて聞く方も多いと思いますが、Office365以前のIBM製のグループウェアです)
そのようななかで、情報革命の完了のために、生成AIの普及を完了させるには、
・使いやすいインターフェイス
・欲しい回答が得られること
の2つが重要だと考えています。
生成AIにおけるベンチャーの勝ち筋
「ゴールドラッシュでは、ツルハシを売れ」という格言があります。
生成AIにおけるツルハシとは何でしょうか。
おそらく、半導体で、GPUでは一強となっているNVIDIAがツルハシメーカーに当たるはずです。
生成AIのファンデーションモデル開発は、
OpenAI・MS連合、Google、AWSなどクラウドベンダーが中心にいます。
現時点ではOpenAIのGPT-4が強いですが、1年前に公開されたGPT-3.5については、
いくつかのオープンソースが匹敵する性能を達成しており、我々としては、どれを使っても性能は大丈夫という状況になっていくはずで、
ほかのアプリケーションやインフラとの関係で、どれを使うかを決めるようになるはずです。
そういった意味では、これらのプレイヤーはゴールドラッシュにおける鉄道王といったところでしょうか。
MSのOpenAIへの出資や、AWSのAnthropicへの出資がクラウドチケットという話を聞くと、
ウェルズ・ファーゴといったところかもしれません。
その上で、ベンチャーの戦場はアプリケーションレイヤーになるはずです。
そのアプリケーションレイヤーでも、
DuetAIやMS copilotなどMSやGoogleとの戦いもあります。
また、toCではAppleの動きも目を離せません。
一方で、まだまだ、情報革命を完了させられるようなアプリケーションは国内ではまだまだ出てきていない認識です。
2024年以降、このレイヤーが盛り上がると考えています。
ここから、リーバイスやヒルトンといった様々な周辺ビジネスが勃興するはずです。
LightblueでもSlack/TeamsでLLMが使える「Lightblue Assistant」というサービスを提供しています。
使いやすいインターフェイスとして、Slack等から直接使えるようにしており、
また、Slackから使う前提で、欲しい回答が得られるように、Prompt-Engineeringが不要になるような裏側の仕組みを構築しています。
Lightblue Assistantについてはインタビュー記事をぜひご覧ください。
Lightblue Assistantについて、「ChatGPTをSlackから使えるようにしただけでしょ?」という指摘を受けることがよくあります。
機能表だけ見ると、そう思われても仕方ないのですが、
実際は、「欲しい回答が得られる」という部分が非常に重要で、こここそがコアなバリューとなると考えています。
様々なサービスでチャットボットが導入されていますが、あってよかったと思うことはどれくらいあるでしょうか?
電話しないと解決しないじゃんと思うこと多いですよね?
2011年にはIBMから公開されたワトソンがクイズ番組「ジェパディ!」で人間を超えていて、
そのワトソンを使ったチャットボットがリリースされ導入企業も増えましたが、
多くの地銀ではパークシャ社のチャットボットが採用されていたりします。
これは、導入の際のデータサイエンティストのCS力にあると我々は分析しています。
優れたエンジンがあっても、まだまだ欲しい回答を得るための工夫が必要であり、
その工夫を、ユーザーが行う必要がなくなるチューニングこそが、
情報革命の完了に必要なことだと考えています。
このようなチューニングについては、一定の業務理解が必要であり、
MSやGoogleとの戦いにも勝てる余地があると考えています。
一方で、この戦いに参加するにはファンデーションモデルの知見が必要であると考えており、
Lightblueでは生成AI・LLMのR&Dを目的としてLlabを設立し、ファンデーションモデルの事前学習を行っています。
Llabが公開しているモデルは日本語での性能はトップクラスです。
ファンデーションモデルの知見があるからこそ、
クラウドベンダーが提供するファンデーションモデルの性能を最大限活用できると考えています。
Lightblue「Karasu/Qarasu」シリーズの性能。MTベンチのスコア
採用積極募集中
そんなわけで、「情報革命を終わらせる」仲間を探しています。
特に、プロダクト開発の経験があるCTO・テックリード経験者とデータサイエンティストを特に募集しています。
Lightblueでは従来の生成AI・LLMのコンサルティング事業に加え、Lightblue AssistantというSaaSプロダクトを立ち上げ、2事業に増えており、
アプリケーションの戦いに勝てる経営体制の強化が重要だと考えています。
ゴールドラッシュで、デニムを作るのか、ホテルをやるのか、ツルハシを作るのかは、様々な選択肢があると思いますが、
いずれにせよ金鉱のあるカリフォルニアにいる必要はあります。
これまで鍛えたスキルを、より社会インパクトが大きい領域に適用して新しいキャリアパスを築いていきたいエンジニアを特に募集しています。
情報革命が終わった先に、そのとき、金鉱にいて、ヒルトンの一号店によく泊まってたんだよ。そこで、情報革命を終わらせたんだよ!と一緒に言いましょう。
少しでも興味を持った方はご連絡をお待ちしております!
まずお茶からでも。よろしくお願いします。