東京都が発表した「文章生成AI利活用ガイドライン」
2023年8月23日、東京都デジタルサービス局は「文章生成AI利活用ガイドライン」(Version1.0)を公開した。同ガイドラインは都の職員が文章生成AIをデジタルツールとして活用し、行政サービスの質を高め、都政のQoS(Quality of Service)を向上させていくための指針を提供する。対象とする文章生成AIはChatGPTだ。デジタルサービス局では文章生成AI利活用のプロジェクトチームを4月に立ち上げて議論を重ね、8月から全局での導入にいたっている。
仕事に厳格な正確性が要求される日本最大の地方公共団体が導入したのだから、ChatGPTに囁かれる不安の払拭も当然済んでいるのだろう。東京都の導入方法を踏襲すれば、多くの企業もChatGPTを安全に導入し、生産性向上を目指せるのではないだろうか?
もはや説明の必要もないかもしれないが、ChatGPTは OpenAI社が開発した文章生成AIで、大規模言語モデルのG PT-3.5を利用したチャット形式のWebサービスとして、2022年11月に公開された。それまでは画像中心だったAIが、人間の会話に近い出力ができるようになったと話題になり、リリースからわずか2ヶ月で1億人を超えるユーザーを獲得した。
2023年1月には、以前からOpenAIに多額の投資を行っていたMicrosoftが100億ドル規模の追加投資を発表したことでも注目を集めた。3月にはGPT4が発表され、またChatGPTのAPIが公開されたことで、多くの企業がChatGPTベースの新サービスを次々に発表していった。現在、画像や映像系のサービスを合わせると、生成AIサービスは数千規模で提供されるという活況を呈している。
文章生成AIのリスクをどう回避するか?
文章生成AIのリスクとしては、情報漏洩、不正確な記述、著作権侵害の危険が言われている。行政分野で文章生成AIを利用するにあたっては、どれも回避しなくてはならない問題だ。都のガイドラインでは、どのように対処を打ち出しているのだろうか?
ガイドライン中の「取組の方向性」の図では、文章生成AIのリスクと活用可能性について、3つの視点から考察、それぞれをガイドラインの2〜4章で展開している。特徴的なのは2章の「利用環境」だ。OpenAIのChatGPTは登録さえすれば無料でも利用できるサービスなのだが、都デジタルサービス局はセキュアな運用面を考慮して、職員が使用する共通基盤の環境構築から開始している。
都が選択したのはMicrosoftが提供する有料のAzure OpenAI Serviceだ。選択にあたって確認したのは「入力データが学習目的で利用されない」「入力データの保存をサーバー側で行わない」という2点で、これにより情報漏洩リスクを可能な限り低減したという。同ガイドに掲載されたシステム構成イメージによれば、プロンプト・回答用インターフェイスを都側に置き、そこからAPI経由でAzure OpenAI Serviceを使用している。
利用上のルールは4つ
もちろん、環境を整えるだけで全てのリスクを回避できるわけではない。回避できるのなら、ガイドラインは必要ないだろう。そこで、ガイドラインには第3章として「利用上のルール」が定められている。まず、用意された共通基盤上のみで使用することを前提とし、利用開始前には、利用申請フォームによる申請と、e-ラーニング受講を義務付けている。そして、利用時のルールとして、以下の4点を定めている。
ルール1:個人情報等、機密性の高い情報は入力しないこと
ルール2:著作権保護の観点から、以下の点を十分注意し、確認
・既存の著作物に類似する文章の生成につながるようなプロンプトを入力しないこと
・回答を配信・公開等する場合、既存の著作物等に類似しないか入念に確認
ルール3:文章生成AI が生成した回答の根拠や裏付けを必ず自ら確認
ルール4:文章生成AI の回答を対外的にそのまま使用する場合は、その旨明記
プロンプトに使用する情報の制限と、回答の根拠や著作権抵触の危険の確認、対外的な使用では出典を明記するというものだ。情報制限の範囲については、「東京都サイバーセキュリティ基本方針」との整合性も必要になる。ただ、ルール2と3の確認については、何を使って確認するかは述べられておらず、あくまでもケースバイケースということなのだろう。
効果的な活用には2段階のプロンプトで
リスクは回避しても、職員がこの初めてのツールを使ってくれなくては、生産性の向上は望めない。効果的な使用法の解説が必要になる。デジタルサービス局内では、文章生成AIの効果的な活用法についてアイデアソンを実施し、103個のアイデアの分類から、有効な分野とプロンプトの手法を導き出している。向いているのは要約、翻訳、文案作成などの「文書作成の補助」、文章生成AIの回答に対し、重ねたプロンプトで深堀りしていく「壁打ち」による考えの整理や事業企画におけるペルソナ分析などの「アイデア出し」、マクロ、VBAなど「ローコード等の生成」で、一方、向いていないのは検索や数学的な計算などだ。検索が適していないのは、都が利用するサービスがGPT3.5ベースであるため、2021年9月以降の情報が対象になっていないためだ。これらの向き不向きについて、プロンプトと回答の例を個別に解説し、実際に使用するときの参考になるよう掲載している。
また、文章生成AIを効果的に使うために必要となる有効なプロンプトのコツとして、2段階の入力を推奨している。Step1としては、必要な情報を引き出し整理するために、立場や具体的な目的・背景の明示、出力形式の指定に注意し、Step2では視点を加え回答をブラッシュアップするよう述べている。
東京都以外の生成AI利用ガイドライン
実は、ChatGPTの利用ガイドラインを公開したのは東京都だけではない。都が発表した数日後には神奈川県が「神奈川県生成AIの利用ガイドライン(第1版 令和5年8月)」を発表している。リスク回避の方法については、東京都のガイドラインとほぼ同じだが、著作権侵害に加え登録商標侵害のリスクについて特許情報プラットフォームの使用を推奨したり、事例が異なっていたりするので、これからChatGPTの導入を考える企業の担当者はこちらも一読をお勧めする。
こうしてガイドラインが複数出てくる背景には、5月にAIの第一人者である東京大学大学院の松尾豊教授が理事長を務める一般社団法人ディープラーニング協会が、「生成AIの利用ガイドライン」を発表した影響が大きいようだ。ディープラーニング協会は設立目的として「ディープラーニングを中心とする技術による日本の産業競争力の向上」を目指すと謳っているAI技術の総本山的な団体だが、同協会が発表したガイドラインはそのまま使える完成品ではなく、企業や団体などが独自の利用ガイドラインを作成するための雛形の形式をとっており、文中の【】の中を、それぞれのポリシーなどに沿った形で埋めていくと、固有の生成AI利用ガイドラインができあがるというものだ。
これが発表されたことにより、多くの企業や自治体が、自社・自組織のためのAI利用ガイドラインの作成に取り組んだと思われる。都の取組は4月からだが、参考にはしただろう。神奈川県のガイドラインも、ディープラーニング協会のガイドラインの影響を受けているようだ。企業からの発表があまり見られないのは、企業は内部向けにアナウンスしてビジネスに利用していけばいいわけだからだ。
一方、自治体は生成AI利用の直接の目的は、企業同様効率化や生産性向上にあっても、そこから目指すべき最終目標は住民サービスの向上なので、そのための努力姿勢を住民に説明し、採用する手法の安全性も住民に示す必要があるため、公開という形になったのだろう。
その他にも、政府のAI戦略会議が「新AI事業者ガイドライン スケルトン(案)」を9月に発表している。こちらはまだ「スケルトン(案)」で、開発者向けやサービス実施者向け、事業で利用する者向けさまざまな事業者に向けた詳しいガイドラインを議論していくための骨子という段階だが、今後検討が継続し、さまざまな企業の役割や立場にとって有用な指針となっていくだろう。
文章生成AIは多くの職を奪うのではないかという予測もあり、警戒している人も多いだろうが、急激な人口減少・人手不足の只中にある日本では、効率化、生産性向上のためにもいたずらに排斥すべきテクノロジーではないだろう。いち早くガイドラインを公開してきた東京都は「都庁働き方改革」宣言(2017)や東京都職員「ライフ・ワーク・バランス」推進プラン(2017年制定、2021年改訂)など、常に職員の働き方の改善に熱心に取り組んできた。文章生成AIの導入もこうした流れの中の位置付けとして、職員の働き方の自由度を高めるためのものと見ていくべきだろう。
文章生成AIの安全かつスムーズな導入を目指す企業は、都のガイドラインのリスク回避作とプロンプト事例をぜひ参考にしてほしい。その先にはビジネスの発展と、従業員のより自由な働き方の実現が待っているはずだ。