こんにちは!
エス・エー・エス株式会社の海田です。
2月になりました。
関東でも雪が結構降り積もったかと思えば、20度超えの温かい日もありました。
気温の寒暖差が激しい今日この頃ですね。
1.Googleの生成AI「Gemini」誕生!
2024年2月8日に、Googleから新しい生成系AIが誕生しました。といっても完全新規ではなく、もともとは「Bard」という名前で提供していたサービスです。「Bard」が「Gemini」という名前に変更されました。
もともとGoogleでは無償の「Bard」と有償の「GeminiPro」の2つの生成AIサービスが提供されていたのですが、「Bard」→「Gemini」に、「GeminiPro」→「GeminiAdvanced」になったという理解で正しいようです。ただ名前が変更されただけでなく、以前の「GeminiPro」に搭載されていた一部の機能も「Gemini」に搭載されているようなので、パワーアップしてシリーズ名を統一させたということなのかなと思っています。
2.パン屋さんを見つけるために使ってみる
ということで、さっそく試してみましょう。Google提供サービスなので、Googleアカウントがあればだれでも即利用できます。見た目もChatGPTとほぼ同じなので、ChatGPTを利用した方であればすぐに慣れると思います。Geminiの方が若干UIが先進的かな・・と感じました。
以前、ChatGPTを使って地元のおいしいパン屋さんを見つける試みは、架空のパン屋さんを連発してきました。このあたりが「Gemini」ではどういう結果になるのか、まずは試してみたいと思います。
ずらずら~と表が並び回答が表示されますが、回答やリンク先はすべて正しかったです。(ChatGPTとは違い少なくとも実在している場所でした)
やはりGoogleMapと連携できるのが大きいですね。事実に基づいた位置情報をもとに生成できるのはGeminiの大きな強みかもしれません。また、回答によってはGoogleMAPで検索結果の場所を表示してくれます。(ただし何度か試行していると、結構な頻度でAPIが失敗していましたのでこのあたりの安定性の改善を期待したいですね。)
3.技術サービスの比較として使ってみる
次に、AWSのECS(EC2)とFargateの違いについてリクエストしてみました。
プロンプトには特に細かな条件を入れなかったのですが、それぞれの比較項目も自動生成して作成してくれました。最後列の「どちらがおすすめ?」という項目も選択の基準になりそうでいいですね。ちなみに(私の認識している範囲では)回答結果はすべて正しかったです。
表の最後にある、「Googleスプレッドシートにエクスポート」というのも非常に便利な機能かと思いました。クリックするだけで、以下のようにスプレッドシートに出力してくれます。便利ですね。
4.画像生成、音楽生成はできるのか?
過去のTechBlogではStableDiffusionやCopilotのDALL-E3、またSunoなど、画像生成や音楽生成のAIを試行してきました。果たしてGeminiでは可能なのか、聞いてみます。
一応、可能と回答されました。なのでリクエストをしてみます。
ダメみたいですね・・。まだサポートされていないということは、いつかはサポートされるのでしょうか。音楽についてもリクエストしてみます。
音源そのものではなく、耳コピのラフイメージみたいな感じで、文字で回答が返ってきました。回答の中には音源URLみたいなカテゴリもありましたが、実際のリンクは作成されていませんでした。現時点では、画像や音楽生成に関しては不可能のようです。(Geminiは可能と回答していますが・・)
5.Geminiの強み、弱み
ChatGPTと比べてGeminiはどうなのか?Gemini自身に聞いてみました。
クリエイティブな部分ではChatGPT、情報検索など正確性を求めるのであればGeminiと(Gemini自身は)評価しているようです。やはり、GoogleエンジンやMAPなどのサービスとの連携を強みとしているようですね。
6.まとめ
私は以前のBard時代に利用したことがなかったので、Bardに比べて新Geminiがどれくらい使いやすくなっているのかはわからないのですが、あくまで主観では、回答速度はChatGPTが一番早く、その次にGemini、Copilotと続く印象です。Copilotは回答速度はとても遅いですが、回答の制度をGUIで簡単に設定したり、画像やSunoと連携できる(1日の利用制限あり)のは強みですね。
ちなみにGeminiとは「ふたご座」という意味です。Geminiに聞いてみました。
ユーザと寄り添っていくAIでありたいという思いを込めて、Geminiと名付けたようですね。今後ますます使いやすくなっていくのかなと思います。ちなみに以前の「Bard」は鳥ではなく「吟遊詩人」です。よくゲームのジョブで出てきますね。
Geminiの強みは「事実に基づく調査やまとめ」とのことなので、例えば技術に関する問い合わせだったり、私のようにお気に入りのパン屋さんを探したりするようなタスクにはとても適しているのではないでしょうか。欲しい商品のスペック比較とかにも適していそうです。一方、小説や絵、曲などクリエイティブ用途に使っていきたい場合は、現状ではCopilotかなという印象でした。
今回はGeminiを初めて使ってみた感想をまとめてみました。皆様も是非使って体験してみてください。最後まで読んでくださってありがとうございました!