今月のテーマは……
Gemini 1.5 Pro を採用
進化を続ける「Geminiアプリ」

2024年5月号の本連載で、「ユーザーの右腕的存在として『 Gemini アプリ 』を活用すべし」とお話しました。そこからわずか、2〜3カ月という短期間に Gemini アプリ はさらに大きな進歩を遂げていますので、今号では、これについてお伝えします。「 Gemini 」に限らず、昨今のAI関連テクノロジーの進歩のスピードは驚くべきものです。

庄司大助(Dandy)
所属:グーグル・クラウド・ジャパン
パートナーエンジニアリング本部
役職:パートナーエンジニア
経歴:大学卒業後、日系の中堅企業のIT部門で、ITインフラ担当者として入社後、自動車系IT企業にて、ネットワークエンジニアを経験。その後、マイクロソフトにて、10年以上にわたり、オンプレミスからクラウドまで幅広くプリセールス活動に従事。現職に至る。

Gemini 1.5 Pro をLLMとして提供

Google Workspace 」を拡張できるアドオンの「 Gemini for Google Workspace 」では、複数の大規模言語モデル(LLM)を用いて、文書作成、画像作成、インターネット上の情報収集といったさまざまなユーザー支援を行ってくれます。

 Gemini アプリ には、最新のLLMである「 Gemini 1.5 Pro 」が採用されています。Gemini アプリに指示を出す際は、プロンプトと呼ばれる指示内容を記載します。Gemini アプリに渡す情報が、長文の文書や大量のコード、長時間の音声・動画などであっても、短い時間で答えを返してくれます。具体的な数字で言うと、一度に1,500ページの文書を理解したり、約100通の電子メールを要約したりといったことが可能になる規模感です。人間には全くこなせない、想像をはるかに超える量だと思います。

▲ Gemini アプリ のプロンプト入力画面。
▲ プロンプトに入力した質問に対して、5~10秒程度で回答を得られる。

お問い合わせチャットボットとして活用

 前述の通り、強力なLLMを備えたGemini アプリは、プロンプト入力の際、大量のデータを一度に読み込んで、質問に答えてくれます。操作方法は以下の画像の通り、プロンプト入力をするエリアに「+」マークがありますので、ここに読み込ませたいファイルを指定します。そして、プロンプトを入力します。

 読み込ませるデータの大きさにより応答速度は変わりますが、数MB程度の資料ですと、答えは5~10秒程度で得られます。

 このような特性を利用して、ヘルプデスク業務を行っている事例もあります。また、社内の各種規定について、総務担当者にメールやチャットで問い合わせるのではなく、Gemini アプリ に問い合わせることで、業務効率向上に生かすケースもあります。

 今後の話にはなりますが、特定の文書を指定して、データを Gemini アプリ に読み込ませるのではなく、「 Google ドライブ にあるデータから、答えを教えて」といった利用方法も可能です。開発が先行しているコンシューマー向けの「 Gemini Advenced 」だと、すでにこの機能を利用できるようになっています(2024年6月末時点)。

 企業には膨大な量のデータ資産があるかと思いますが、このデータから洞察を得る、情報を抽出するということが、Gemini アプリを使えるようにさえすれば特別な開発もなく、すぐに利用できるようになります。

 社内データの活用となると、セキュリティに関する心配をされる方もいらっしゃるかもしれません。本来知ってはいけない、見えてはいけないデータが Gemini アプリを通じて悪用されてしまうのではないか? という懸念は不要です。Google Workspace に追加できる生成AIアドオンサービスである Gemini for Google Workspace では、企業で求められる厳格なアクセス権を考慮しています。プロンプトを入力した本人にアクセス権のあるデータから、答えを返してくれます。役職者にしかアクセス権のないデータを一般社員が Gemini アプリを通じて取得できてしまうということは一切ありません。従って、生成AIと企業内のデータを連携・活用させる際は、今まで同様、データの適切なアクセス権設定が欠かせません。

 また、生成AIを活用する上では、社内データを余すことなく、AIに読み込ませることが重要です。「最新のデータはオンプレミスのファイルサーバーにしかない」「個人のローカルPCにしかない」という状況では、生成AIの素晴らしいパワーを生かしきれません。データのクラウドシフトも、ぜひ、継続してください。

▲「画像をアップロード」「ファイルをアップロード」「ドライブから追加」から選択できる。
▲ DISの新しいロゴマークを Gemini アプリに作ってもらった。

マルチモーダルな特長も進化

 過去の Gemini アプリの紹介では、画像をアップロードして、そこから洞察を得るといった一例を紹介しました。今号では、その逆で、テキストから画像を作成する方法を紹介します。執筆時点の最新機能であるため、現段階では英語でのプロンプト入力のみにしか対応していませんが、Gemini 1.5 Pro で、より創造的な業務にも活用いただける一例を紹介します。

 本誌の発行元であるダイワボウ情報システム(DIS)の新しいロゴマークを Gemini アプリに作ってもらいました。入力したプロンプト(DISが22世紀に、宇宙産業のリーダーとなっていることを想定します。世界で最先端なイメージを印象付けるため、新しい会社のロゴを作成してください。)を Google 翻訳を活用して英語に変換し、Gemini アプリから出力された結果が上の画像です。とても数十秒で作られたとは思えないクオリティに感じるのは、私だけでしょうか?

 Gemini for Google Workspace の基盤となるGemini 1.5 Pro ならびに、Gemini アプリのパワーを業務にぜひ一度活用してください。1日も早くこのパワーを使いこなすことが業務効率を向上させ、限られた人数で大きな成果を生み、新しいビジネスの創出などにもつながると信じています。次号以降でも、都度、Google Workspace の進化について紹介していきますのでお楽しみに。


Google Workspace 、Gemini for Google Workspace 、Gemini 、AppSheet 、Google ドキュメント 、Google スライド 、Google スプレッドシート 、Google Chat は、Google LLC の商標です。