ChatGPTは何者か

~ChatGPTの基礎解説と用途の可能性~

世界中で突然、ChatGPTと呼ばれるAIサービスが話題となり、その利用について賛否を巻き起こしている。ChatGPTの開発元であるOpenAIは営利法人のOpenAI LPとその親会社である非営利法人のOpenAI Inc.で構成されるAI研究所で、2015年にイーロン・マスク氏らによって設立された。最近ではマイクロソフトがOpenAI LPに大型投資を行っており、自社サービスとの連携を進めている。一方でOpenAIの設立に携わったマスク氏を含むテクノロジーリーダーと研究者は今年3月29日に公開書簡にて「(AIツールが)社会と人類に深刻なリスクをもたらす」と警告している。また技術開発における倫理問題に取り組む非営利調査団体「AIデジタル政策センター(CAIDP)」が米連邦取引委員会(FTC)にOpenAIの最新言語モデル「GPT-4」の商業リリースの中止を求める書簡を提出したことや、イタリア当局はChatGPTの利用を一時的に禁止したと報じられている。突如姿を現したChatGPTとは一体何者なのだろうか。果たして社会や人類の味方なのか、それとも警戒すべき存在なのか、ChatGPTの基礎知識と用途の可能性についてリポートする。

ChatGPTが引き起こしたAI革命の本質
AIは社会やビジネスのインフラになる

ChatGPTとGPTの基礎解説


〜アステリア&アステリアART〜

ChatGPTは味方として付き合うべきなのか、それとも警戒すべき存在なのか、自社およびユーザーのソフトウェア開発においてAIや機械学習の有効性に着目し、2018年から研究開発の基盤の一つに取り込み、2019年にはAI研究開発子会社となるアステリアArtificial Recognition Technology合同会社(アステリアART)を設立したアステリアに、ChatGPTの基礎解説と用途、そして自社での活用について話を伺った。

ChatGPTはチャットボットと異なり分野や領域を超えて自然な会話ができる

アステリア
代表取締役社長/CEO
平野洋一郎

 ChatGPTはOpenAIが2022年11月に公開したAIチャットボットサービスだ。サービス名に含まれる「GPT」とは「Generative Pre-trained Transformer」の略称で、「生成可能な事前学習済み変換器(翻訳器)」を意味する。ChatGPTはWebサイトで公開されており、今のところアカウントを作成すれば誰でも無料ですぐに利用できる。

 使い方は簡単だ。WebサイトのChatGPTの画面上でユーザーが知りたいことなど、人としゃべる感覚で文章を入力すると、その内容に対して人がしゃべっているような自然な文章でChatGPTが回答してくれる。ちなみにユーザーが入力するテキストのことを「プロンプト」と呼ぶ。

 ChatGPTはいわゆるチャットボットではあるが、長文の自然な文章で入力されたプロンプトに対して、自然な文章で長文の回答を返してくる(文章を生成できる)点が従来のチャットボットと大きく異なる。しかもユーザーが入力するプロンプトに関して、分野や領域を特定しない点も大きな特徴だ。いわばChatGPTは博識な先生であり、助手であり、アドバイザーといった存在だ。

 なぜChatGPTに何でも質問したり、相談したりできるのだろうか。アステリアのノーコード変革推進室でエバンジェリストを務める森 一弥氏は次のように説明する。「AIには判断の基となるモデル(学習データ)が必要となりますが、モデルは学習が進むほどデータ量が大きくなり、それを利用する際の処理に必要なコンピューターリソースも大きくなるため、分野や用途を限定してモデルを構築することが一般的です。ところがChatGPTが使用しているモデルである「GPT」はさまざまな分野や領域の複数のモデルを合体させた「大規模単一モデル」と呼ばれるモデルを構築しているため、さまざまな分野や領域にわたるプロンプトに対して回答、すなわち自然な文章を生成できるのです」

自然な文章を生成できる理由
次の単語、次の一文字を予測

アステリア
ノーコード変革推進室
エバンジェリスト
森 一弥

 さらに人が話すような自然な文章を生成できる理由について次のように解説する。森氏は「ChatGPTのモデルとしてGPTを使用していることは前述の通りです。ChatGPTが使用するのは言語モデルと呼ばれ、人間の言語を単語の出現確率を用いてモデル化したものです。そしてChatGPTが使用する言語モデル、すなわちGPTに含まれるモデルですが、その基になっているのがグーグルが2017年に発表した『Transformer』と呼ばれるモデルです。このTransformerは機械翻訳のために作成された言語モデルで、単語ごとの対訳ではなく、入力された原文に対して訳文に続く単語を次々と予測して作成するため流ちょうな訳文が生成されます。さまざまな言語の大量の文章を事前に学習させることで、多国語対応、訳文の精度を実現しています」と説明する。

 このTransformerの仕組みを基に作成された言語モデルを使用するChatGPTも、質問の内容やそれまでの話の流れを原文とすることで回答の文章を訳文として生成していると言う。

 モデルの適用範囲、および精度を向上させるには学習が欠かせない。その学習方法には大きく「Pre-training」と「Fine-tuning」の二つの訓練がある。言語モデルを例に挙げるとPre-trainingでは大量のデータから言語の特徴を学習する。そしてFine-tuningにおいて比較的少量のデータで特定のタスクを学習して、翻訳や質問への回答、チャットといったサービスを実現する。

 ChatGPTが使用するモデルであるGPTでのPre-trainingでは、例えば「今日のランチは」という文章に対して「サラダ」という単語を予測するのではなく次の一文字となる「サ」を予測することで、単語の位置や単語間の関係を学習する。そのため長文に対応できる。

 同様にFine-tuningでは「今日のランチは?」という質問に対して、前提知識として「サラダ」と「パスタ」を学習しているとして、質問文と前提知識から回答を推測して回答文を出力するように学習させる。

 さらにGPTの第三世代となる「GPT-3」や、GPT-3に改良を加えた「GPT-3.5」を使用するChatGPTでは「Sparse-Transformer」と呼ばれるテクノロジーを利用することでFine-tuningを不要としている。例えば「リンゴはApple」と例示して「バナナは?」と問いかけると、例示から英訳問題だと解釈して、インターネット上で公開されている情報から「Banana」という回答を生成する。

 このとき前提知識(データセット)のサイズやパラメータ(学習結果)の数を増やすことができれば、AIの適用範囲が拡大し、精度が向上する。ちなみにGPT-3では1,750億個ものパラメータが含まれており、人間並みの自然な文章の生成を実現している。さらに今年3月に発表されたGPTの最新版「GPT-4」はテキストに加えて画像の入力にも対応したマルチモーダルモデルとなり、精度も向上しており、模擬司法試験で受験者上位10%の成績を収めたと話題になった。

計算資源への莫大な投資が可能にチャットによりAIが身近になった

 訓練時間を増やしてデータセットのサイズとパラメータの数を増やすことでAIの適用範囲の拡大、精度の向上が期待できるが、それにはモデルを処理するコンピューターリソース(計算資源)への大きな投資が必要になる。さらに複数の異なるモデルを合体させた大規模単一モデルの構築と、その育成に必要となるコンピューターリソースへの投資は莫大だ。

 しかも投資をする資金があったとしても、どれだけ投資をすればどれだけの効果が得られるのかが分からなければ投資はしにくい。この課題が2020年に解決したことで、大規模単一モデルの構築、育成が加速し、一般的に入手可能なGPUで数百年かかる計算が瞬く間に処理できるようになり、ChatGPTなどのサービスが提供されるようになったのだ。

 ある報道によるとChatGPTのアクティブユーザー数が1億人を突破するまで、わずか2カ月しかかからなかったという。ちなみにTikTokは9カ月、インスタグラムは2年半と言われている。ChatGPTの急速な普及は突如としてAIが進歩したような印象を受ける。しかし早くからAIの研究開発に取り組んできたアステリアの代表取締役社長/CEOを務める平野洋一郎氏は次のように指摘する。

「AIの研究開発は一定のスピードで着々と進められており、突如進歩したというわけではありません。昨今AIが注目されるようになったのは、ChatGPTのチャットというアプリケーションによって誰もがAIの効果を気軽に、簡単に体験できるようになったからでしょう」

 GPTはAPIを通じて既存あるいは新たに構築するシステムやアプリケーションと連携してAIを活用できるが、AIの効果を体験できるのはソフトウェア開発に携わるエンジニアに限られる。しかしChatGPTでは一般のユーザーがチャットというアプリケーションを通じてAIを直接利用できる。これがAIの一般ユーザーへの普及のきっかけだ。

 ところでOpenAIが提供するAIサービスは大規模単一モデルを含むGPTに加えて、AIチャットボットのChatGPT、さらに「DALL・E」や「OpenAI Codex」もある。DALL・Eは言語モデルと画像生成モデルを組み合わせたAIサービスで、自然な文章のプロンプトからイラストや写真を生成する。現在は「DALL・E 2」も発表されている。

 そしてOpenAI Codexは自然な文章のプロンプトからOpenAI Codexが対応するプログラム(コード)を生成するAIサービスだ。例えば「東京都に住む名前が佐藤である全ての顧客を返すクエリを教えてください」と入力すると、それに対応するコードが生成される仕組みで、ソフトウェア開発の生産性向上と、ローコード・ノーコードの活用支援が期待できる。

ChatGPTをビジネスに生かすべきか活用における注意点とAIへの期待

 現在のChatGPTはテキストの入力のみに対応しており、モデルにGPT-3.5が使用されていることは前述の通りだ。ではChatGPTを使うと何ができるだろうか。まず分からないことを聞いたり、したいことをどのようにすればいいのかといった相談をしたりするなど、専門家や助手、アドバイザーといった使い方ができる。

 また文書の要約や翻訳、文書のひな形の作成、文書やプログラムのミスの指摘、校正、そしてプログラムのひな形やテストデータの作成といった使い方も可能だ。さらにアプリケーションやシステムと連携して新しいサービスを生み出すこともできるだろう。

 アステリアの森氏は「ChatGPTをはじめAIは『便利な道具』であり、主体は人です」とアドバイスする。ただし注意しなければならない点もある。ChatGPTが生成する文章は最新情報ではないことだ。そのため天気や交通情報など、リアルタイムの情報は期待できない。そして生成された文書が必ずしも真実ではないことにも注意したい。

 しかしChatGPTが使用するモデルのGPTは「インターネット上で公開されているあらゆる情報を学習していることに加えて、世界中のユーザーが使用することによって訓練を続けており、常に進歩しています。ChatGPTによってユーザー数が爆発的に増加しており、それによる訓練の回数が増加することで、精度の向上が加速するでしょう」(平野氏)と指摘する。

ChatGPTでプログラムを作成する例
ChatGPTにWebシステムのログイン画面の作成を依頼してコードの一例を生成してもらう。

(左)ChatGPTが生成したコード。
(右)ChatGPTが生成したコードをHTMLファイルで保存してWebブラウザーで開くと、ログイン画面が表示された。

 ソフトウェアを開発するアステリアでもChatGPTなどのAIテクノロジーを積極的に研究開発や製品、サービスに取り入れている。森氏は「AI研究開発子会社のアステリアARTでAIを積極的に活用しています。コードを生成する際に、例えばライブラリを使ってこういう処理をしたいとChatGPTにテキストで入力するとコードが生成されます。そのまま使えるわけではありませんが、少し修正すれば使える品質を実現しています。リファレンスライブラリから検索するよりも、ChatGPTにサンプルを作ってもらった方がエンジニアにとって効率が良いと思います」と指摘する。

 また「作成したコードが動かない時にChatGPTにコードを入力すると、コードの全体のロジックを学習して、それに対して問題点を指摘してくれます。例えば全体が非同期で記述されているのに、この部分は矛盾するといった具合です。コンパイラとは違った意見を言ってくれますので、不具合が生じた場合に参考になります」と説明する。

 今後のAIの活用について平野氏は「製品やサービスにAIの利点を取り込んでいきます。すでにノーコードプラットフォームのGravioで認識系AIを搭載していますが、今後は生成系AIを組み込んで、例えばユーザーがしゃべったらアプリケーションが生成されるような機能を実現したいと考えています。そしてGPTはAPIが公開されていますがプログラマーしか利用できません。ノーコードでGPTを使えるようにして、ユーザーにさまざまな用途でAIの利点を生かせる環境を提供したいと考えています」とアピールする。

 最後に平野氏は「ようやくAIが世の中に受け入れられるようになりました。セキュリティのリスクが高まる、既存の仕事が奪われるなどのネガティブな意見もありますが、新しいテクノロジーを取り込まなければ社会もビジネスも進歩することはできません。それにはリスクは伴うものです。どのようなリスクが生じるのかを理解しながら、AIを積極的に活用していくべきです。またAIは便利なツールであり、人に代わるものではありません。効率化によってなくなる作業が出てくる一方で、新しい作業が必要になり、新しいビジネスチャンスが生まれるでしょう。当社にとってAIは全ての製品やサービスのインフラになっていきます。同様に社会にとってもビジネスにとってもAIはインフラになっていくとみています」と強調する。AIに不安や脅威を感じて避けるよりも、味方に付けておいた方が得られるメリットは大きく、リスクは小さくなるのではないだろうか。

GPTとChatGPTを利用した対話型AIアシスタントを国内全社員1万2,500名に向けて導入

ChatGPTとGPTの基礎解説


〜パナソニック コネクト「ConnectGPT」〜

業務でのChatGPTの使用を禁止する企業がある一方で、最新のテクノロジーをいち早く取り入れて有効活用に取り組む企業がある。日本におけるChatGPTのビジネス活用の先頭を行くのがパナソニック コネクトだ。ChatGPTへの議論が過熱するのを横目に、同社は今年2月17日よりGPT-3.5を、同3月13日よりChatGPTも利用したAIアシスタントサービス「ConnectGPT」を導入し、国内の全社員、1万2,500名に向けて業務での活用を開始した。GPT-3.5やChatGPTを業務に導入した狙いや情報漏えいへの対策など、議論となっている気になる事柄について話を伺った。

文書作成における業務の生産性を向上するAIを「聞く」と「頼む」の二つで活用

パナソニック コネクト
IT・デジタル推進本部
シニアマネージャー
向野孔己

 パナソニック コネクトが導入したAIアシスタントサービス「ConnectGPT」は、マイクロソフトのAzure OpenAI Serviceを通じてGPT-3.5とChatGPTを利用し、ユーザーインターフェースにカスタマイズを加えるなどして構築した。

 使い方はプロンプトと呼ばれるテキストの命令文を人に話すような自然な日本語の文章で入力し、チャット形式で対話しながら回答(アドバイス)を得るという、ChatGPTをはじめ一般的なコミュニケーションツールと変わらない。ConnectGPTを導入した経緯について、担当したIT・デジタル推進本部でシニアマネージャーを務める向野孔己氏に聞いた。

 向野氏は「2020年の夏くらいにGPTの可能性に着目していました。多くのビジネスパーソンがGoogle検索を使うように、いずれはGPTのようなAIを業務で日常的に使うようになると想定し、そうであれば早めに使い始めた方がより早くAIとの付き合い方を習得できると考えました。しかし当時は不確実な回答をしたり、日本語の品質が十分ではなかったりしたため、その進歩を見守ることにしました。そしてGPTが進歩してChatGPTも登場し、さらにマイクロソフトがマネージドサービスでこれらを提供したので利用することにしました」と説明する。

 ConnectGPTを導入することで具体的にどのような効果を狙ったのだろうか。向野氏は「資料の作成などの業務で生産性を向上できる」と話す。資料などの文書を作成する際の手順としては、1情報を集める、2情報を整理する、3ドラフト(下書き)を作成する、4仕上げる(判断する)の四つの段階があると説明する。この中の1と2と3についてはAIにサポートを依頼でき、業務の生産性を大幅に向上できると期待した。

 文書作成における1と2と3の作業をAI、すなわちConnectGPTに依頼することにおいて、パナソニック コネクトでは二つの使い方を想定している。一つ目の使い方は「聞く」ことだ。例えば、アドバイスを聞く、専門知識を聞く、アイデアを聞く、ITサポートを聞くなどを想定している。向野氏は「プログラミングなど専門知識を聞くに関してはかなり優秀です。一方で最も期待していたITサポートについては、GPT-3.5やChatGPTの弱点が出てしまい現状は期待した効果を得られていません」と言う。

文書の作成や校正は得意だがITサポートでは弱点を露呈

パナソニック コネクト
執行役員 CIO
IT・デジタル推進本部
マネージングダイレクター
河野昭彦

 GPT-3.5およびChatGPTを社員が業務に使用するに当たって次の五つのポイントを挙げている。まず回答が正しいとは限らないこと、そしてChatGPTが扱う情報は2021年9月までのものなど、情報が最新ではないこと、英語の方が正確な回答が得られること(日本語の学習が十分ではないこと)、公開情報からしか回答しないこと(社内情報は非対応)、未来予測はできないことの五つだ。

 例えばWindowsやTeamsの操作方法を聞いた場合、2021年9月時点の仕様を基に回答するため、最新仕様では操作が異なるため参考にならないといった事象がある。向野氏は「学習データが頻繁に更新されるようになれば、ITヘルプデスクをChatGPTに任せられるようになると期待しています」と話す。

 またパナソニック コネクトの執行役員 CIO IT・デジタル推進本部 マネージングダイレクター 河野昭彦氏は「現状では最新情報を得るにはGoogle検索が適しています。目的や用途に応じてGoogle検索とConnectGPTなどのツールを使い分けるスキルも大切です」と指摘する。

 二つ目の使い方は「頼む」ことで、判断を頼む、文章作成を頼む、資料作成を頼む、プログラムコードの作成を頼むなどを想定している。向野氏は「実際に運用してみたところ日本語と英語の文章の作成や校正は得意で、長文にも対応できます。日本経済の見通しについてのレポートの序文の作成を頼むと、エコノミストが書いたような文章が生成されます。ただし文字数に制限があり、現状では質問と回答を合わせて日本語では2,500文字くらいが上限のようです。GPT-4では2万5,000文字と言われていますので、章単位で文章の作成を頼めるようになるかもしれません」と説明する。

 さらに「プログラムコードの作成も得意で、自然言語からノーコードでプログラムコードを作成できます」と高く評価している。

 向野氏は「どのようなプロンプトに対する回答が得意なのか、あるいは苦手なのかを見極めるためにConnectGPTの回答に対して5段階で評価する機能を実装しています。ConnectGPTではAIをGPT-3.5とChatGPTから選べるのですが、それぞれの評価は5点満点でGPT-3.5が2.8点、ChatGPTが3.75点となっており、GPT-3.5にできることはChatGPTでもできることが分かりました」と言う。

アンケートの回答の分析において9時間の作業をわずか6分で処理

 ConnectGPTの運用を始めて少しの期間しかたっていないが、その成果は得られているようだ。例えば社内ミーティングに対して自由記述でアンケート調査を行った際に得た1,581件の回答に対して、回答の内容をポジティブ、ネガティブ、ニュートラルで感情分析して集計する作業をConnectGPTで処理した。

 人がやる場合は回答の文章を読んで感情を判断し、集計する手順となり、1件当たり20秒を要すると想定した。すると全ての回答を処理するのに9時間かかることになる。これに対してConnectGPTを使うとわずか6分で作業が完了したと言う。

 向野氏は「(前述の)文書作成における1と2と3の作業をConnectGPTに依頼すれば人は4のみをすればいいので4分の3の時間が削減されますが、実際には1と2と3の作業をConnectGPTに依頼するとわずか数十秒で処理できてしまうので、最も大事な4の仕上げるにおいて、アイデアを出すといった創造力を働かせる部分により多くの時間を費やせるようになり、その結果、成果物の品質がぐっと上がります」と期待する効果について説明する。

 さらに河野氏は「ブレストを行う場合、今までは初期の段階から始めていましたが、ConnectGPTを利用することである程度準備した状態から始められるようになりました。例えばITと法務がミーティングをする場合に双方の専門的な業務を事前にConnectGPTで調べて把握しておけば、ベースラインが高い状態でミーティングが始められ、高いレベルのコミュニケーションによってより大きな成果が期待できます」と説明する。

 また「最近ではConnectGPTをテニスの壁打ちのようにAIと対話する『一人ブレスト』という使い方もされるようになっています。例えば自分の仮説が正しいのか、自分の意見に対してどのような意見があるのかなどを対話していくことでアイデアの質を高めたり、新しいアイデアを生み出したりできます」と言う。

 ただしAIに期待する回答を得るにはAIとの付き合い方を習得する必要がある。つまり質問の仕方次第で回答が変わってくるため、AIから良い回答を引き出すための文章のコツを習得する必要がある。河野氏は「サーチエンジンはキーワードが中心となりますが、汎用型AIの場合は自然言語で対話します。AIアシスタントと呼ばれるくらいなので、人に頼むのと同じように具体的かつ丁寧な文章で聞いたり頼んだりしなければなりません」とアドバイスする。

 パナソニック コネクトではConnectGPTを効果的に活用するための支援策として、ConnectGPTの画面上に利用方法について15のサンプルを用意しているほか、日本語よりも英語の方が回答の精度が高いため、日本語で入力したプロンプトを英語に翻訳する機能および英語の回答を日本語に翻訳する機能を提供している。

ユーザーデータの二次利用の回避と三層での不適切な利用の排除を実装

 GPT-3.5やChatGPTの業務利用において最大の関心事である情報漏えいやセキュリティには、どのような取り組みをしているのだろうか。まずChatGPTの利用規約には英文で「サービス改善のためにユーザーが入力したデータを利用する可能性がある」と書かれており、それを無効にする「オプトアウト(回避)も可能」とされている。

 パナソニック コネクトではConnectGPTを構築するに当たりマイクロソフトのAzure OpenAI Serviceを通じてGPT-3.5とChatGPTを利用している。河野氏は「Azure OpenAI Serviceはユーザーが入力したデータを二次利用しないことも、ConnectGPTにGPT-3.5とChatGPTの利用を決断した理由となりました」と説明する。

 三層で不適切な利用を検知するプロセスと機能も実装している。OpenAIのサービスはインターネット上に公開されている情報を全て学習しているため、その中に個人情報が含まれている可能性がある。しかしOpenAIのサービスには個人を特定したプロンプトの入力に回答しない機能がある。

 加えてAzure OpenAI Serviceには企業向けのコンテンツフィルター機能が用意されており、OpenAIのサービスを利用する前にAzure OpenAI Serviceが不適切なプロンプトを排除するとともに、その前にOpenAI Moderation APIによってプロンプトの内容に不適切な表現が含まれているとアラートを発信する仕組みも提供している。またConnectGPTの利用は社内ネットワークからのアクセスに制限している。

 国内の全社員1万2,500名に向けてサービス提供しているConnectGPTだが、現在のアクティブユーザーは20%ほどで、エンジニアが多いという。向野氏は「サービスの開始当初は1日平均2,637件の利用でしたが現在は5,000件を超えています」とConnectGPTの活用が広がっていると見ている。

 河野氏は「当社は今年4月1日より人事制度をジョブ型人材マネジメントへ移行し、報酬制度も改革して専門的なスキルを持つ人材が活躍できる環境の整備に取り組んでいます。社員には専門的な知識やスキルが求められるようになるため、自身の専門性を高めるアシスタントとしてConnectGPTの役割が重要になり、ConnectGPTのアクティブユーザーはおのずと増えていくと考えています」と語る。

 今後AIの活用が進むことで人がやらなければならない仕事がより明確になっていくだろう。そうなった時に専門性や創造力など、個人が持つ独自能力が強く問われることになる。AIを効率化や生産性向上のための助手という活用だけではなく、アドバイザーとして伴走してもらう活用も重要になってくる。ChatGPTを業務で利用することに慎重な姿勢を取る企業が多い中で、パナソニック コネクトの取り組みはChatGPTなどのAIの業務活用に対する認識を一変させるインパクトがある。