Azure OpenAI Service(AOAI)
GPTモデルが進化
性能アップしたAI機能で事務作業を効率化

今回のAzure 業務改善ファイルでは、「Azure AI Studio」から選択可能な代表的な生成AIモデルである「Azure OpenAI Service」(以下、AOAI)のGPTモデルの進化について説明します。現在、Azureの売り上げは年々増加しており、AI関連サービスの需要が市場の中でますます高まっています。AOAIがリリースされた後、マイクロソフトの全体的なクラウドサービスの成長にAOAIは大きく貢献しています。AOAIにはさまざまなサービスがありますが、その中でも目まぐるしく進化するChatGPTシリーズの機能にフォーカスを当てて見ていきましょう。

日本マイクロソフト
パートナー事業本部
コーポレートソリューション統括本部
パートナーソリューション本部
パートナーソリューションマネージャー
大北崇人

入出力性能がアップしたGPT-4o

 ChatGPTには複数のバージョンが存在します。現行の主要なバージョンは「GPT-3.5」「GPT-4」「GPT-4o」の三つで、最新のモデルはGPT-4oです。このモデルは、テキスト、画像、音声を統合して処理できる「OpenAI」の新しいフラグシップマルチモーダルモデルのAIであり、従来のモデルに比べて大幅に性能が向上しています。

 マルチモーダルモデルは、テキスト、ビジョン、およびオーディオ機能を統合しており、生成および対話型AI体験の新しい基準を設定します。GPT-4oは、テキストと画像のサポートを含むプレビューでマルチモーダルに対応しているので、テキスト、音声、画像の組み合わせを入力として受け取り、それらを組み合わせた出力物の生成が可能です。また、感情が付加された音声や、背景音、複数の話者の情報も正確に認識して表現できます。

 併せて複数の優れた機能を持ち合わせており、その一つとして早いレスポンスの実現が可能です。具体的には、音声入力に対してわずか232msec、平均320msecという速さで応答します。人間の会話に非常に近い応答速度で、リアルタイムのコミュニケーションをサポートします。

 言語においては、英語以外にも多言語に対応しています。日本語や中国語を含む20言語でトークナイザー(自然言語処理を行う際、文章をトークンに分解してコンピューターが処理できる入力形式に変換すること)が改善されました。トークン使用量が圧縮し、日本語では30%のトークン圧縮を実現するなど、大幅に性能が向上しています。

 GPT-4の後継である「GPT-4 Turbo」と比較すると、トークナイザーの速度は約2倍の速さとなっており、おおよそ半分のコストで活用できます。

高速応答&高コスパのGPT-4o mini

 そして、2024年7月に発表された「GPT-4o mini」が最新のモデルです。GPT-4o miniはOpenAIが提供する小型版の大規模言語モデル(LLM)です。GPT-4o miniは、前モデルのGPT-4oに比べてさらに高速な応答を可能としており、リアルタイムのやりとりが求められるアプリケーションにおいて最適なパフォーマンスを実現します。

 APIの使用コストも大幅に低減され、開発者や企業が手軽にAI技術を活用できるようになっており、さまざまなプラットフォームやアプリケーションでの利用を前提に設計されていることで、多岐にわたるシナリオでの活用が可能です。性能とコストのバランスを重視して設計されており、必要な性能をしっかりと確保している点が大きな特長です。つまりGPT-4o miniは、手頃な価格で高度なAI機能を提供することが可能です。特に、予算が限られている中小企業や個人ユーザーにとって、設計時の柔軟性やコストパフォーマンスの高さはAI開発や業務活用を促進する魅力的なポイントとなるでしょう。

 最後に、GPT以外の機能を紹介します。テキストやデータを数値ベクトルに変換することで、これによりテキストの意味を数値的に表現し、類似性を計算できる機能として「Embedding」があります。また、自然言語のテキストプロンプトを入力として受け取り、その内容に基づいて画像を生成するAIモデルが「DALL-E」です。最新のDALL-E3は言語の理解能力が向上し、縦長や横長の画像も生成できるようになっています。

 これらの技術は、クリエイティブなプロジェクトやデザインの分野で幅広く利用されています。そして、多言語音声データを用いて学習を行い、高い精度で音声を文字起こしができる音声認識モデル「Whisper」もさまざまなビジネスシーンに役立つでしょう。「Text to Speech」はテキストを自然な音声に変換する技術で、デジタル形式のテキストを入力として受け取り、人間の声を合成して音声で出力します。Whisper、Text to Speechは共に、事務作業などのビジネスシーンに即座に活用できるでしょう。

 今回は、今月はAOAIを紹介しました。この機会に改めてAOAIの魅力に触れていただき、お客さまへご紹介ください。

◆AOAIユースケース

・会話型 AI
カスタマー サービスを合理化および改善するための AI 生成のボット、質問と回答、コンタクト センター ソリューション。

・コンテンツの作成
クリエイティブなアイデア、デザイン、コンテンツ作成のための GPT-4 や DALL·E などの AI ツール。

・データ グラウンディング
データに対して Azure OpenAI Service を使用して精度と分析情報を高めるためにデータ上でモデルを実行する機能。

Azure OpenAI Service モデルの詳細を知りたい方は上のサイトへ!

text:日本マイクロソフト 大北崇人 氏