今月のテーマは……
シンプルな集計から大規模分析まで行える
「 Google スプレッドシート 」

こんにちは、Google Cloudのキキです。今回は私から、「Google Workspace 」に含まれる「 Google スプレッドシート 」について紹介します。データの集計や分析に表計算ソフトを利用している方は多いと思いますが、操作の複雑性に悩むことも多いのではないでしょうか。AIの技術を使って簡単に、シンプルな集計から大規模分析まで Google スプレッドシート で行う方法を紹介しましょう。

庄司大助(Dandy)
所属:グーグル・クラウド・ジャパン
パートナーエンジニアリング本部
役職:パートナーエンジニア
経歴:大学卒業後、日系の中堅企業のIT部門で、ITインフラ担当者として入社後、自動車系IT企業にて、ネットワークエンジニアを経験。その後、マイクロソフトにて、10年以上にわたり、オンプレミスからクラウドまで幅広くプリセールス活動に従事。現職に至る。
宮崎悦子(Kiki)
所属:グーグル・クラウド・ジャパン
パートナーエンジニアリング本部
役職:パートナーエンジニア
経歴:外資系IT企業でオンプレミス・クラウド製品に関するカスタマーサポートに従事した後、プリセールス活動に従事。得意分野はSaaS、コミュニケーションコラボレーション製品。使っていてワクワクするサービスが好き。

サクサク動く共同編集

 スプレッドシートで行う作業で一番多いのは、実はデータを集めることなのではないでしょうか。私が個人的によく遭遇するのは、組織で共有したシートの必要な場所、指定されたセルに自分に関連する情報を入力・収集することです。

 一般的にスプレッドシートをチームや組織で共有する際、メールの添付ファイルで観覧することが多いと思います。最初に確認した人が編集したスプレッドシートをまた添付してチームへメールし、さらに別の人が次の編集を加えてメールをする、というような流れです。分かりやすい流れなのでうまくいくこともありますが、同時に編集してしまってバージョンが二つに分かれてしまったことはないでしょうか(二つに分かれたバージョンをマージしてくれる親切な人が現れることもありますよね)。メールの添付ではなく、ファイルサーバーに置いたデータで回覧を行うと、バージョンが複数に分かれることは防げるかもしれませんが、一斉に複数のメンバーが同時にファイルを開こうとすると、ファイルにロックがかかってしまう不便も発生します。

 Google スプレッドシートでは、同時編集が既定でできるようになっているので、チーム全員で同時にアクセスし、セルの編集をしようとしても編集がロックされてしまうことはありません。また、データは始めからクラウド上に生成されるので、バージョンが分かれたファイルができてしまったり、編集済みの内容をまた同僚に送信し直したりする必要もないのです。

▲複数人で同時編集していても、誰がどのセルを編集しているのか一目瞭然。
▲エラーになってしまった場合には、数式の変更案を提案してくれる。

AI技術でデータ分析をお助け

 表計算ソフトはさまざまな用途で活躍してくれますが、使いこなすのはなかなか難しい部分もありますよね。Google スプレッドシート では、データの分析や集計を人間が行うのをAIが支援をしてくれるという機能が搭載されています。

 例えば、売上の集計をする際に、それぞれの品目の全体における売上の割合を出すとします(画像右上)。品目の売上を合計の売上で割れば良いので、関数には=[オレンジの売上]/[合計の売上]を入力することで計算できます。続く下の項目についても同じ計算式で計算させるには、セルの右下をドラッグ&ドロップしたり、ダブルクリックしたりすると早く入力できますよね。ただここで、分母となる[合計の売上]のセルの固定を忘れてしまったがために、計算式がエラーとなってしまいました。

 こんな単純なミスでも、Google スプレッドシート では数式の修正案をすぐに提示してくれます。今回は[合計の売上]のB7のセルを固定化すれば良かったので、“数式の候補”として「$を入れてセルを固定化した数式」の候補が掲示されています。この修正案で良ければチェックマークの“提案の承認”をクリックするだけで、全ての数式が修正され、正しい計算結果を得られます。

 数式の修正だけではなく、グラフでの可視化のアイデアや、入力規則に伴ったデータの編集の提案も自動で行ってくれます。大規模なデータを分析して、ビジネスに役立てるために、必要不可欠な機能となっています。

▲アイオワ州の飲料の売上実績(赤線)とそれを基に予測した今後の売上予想(黄線)。

大規模データをピボットテーブルで分析

 表計算ソフトでの集計は慣れると非常に便利ですが、データ量が大量になったときにレスポンスが遅くなったり、エラーで分析できない問題が発生したりすることもあるでしょう。

 Google スプレッドシート では、Google Cloud のデータウェアハウスである「BigQuery」のデータを活用できます。手順はスプレッドシート内の[データ]-[データコネクタ]からBigQueryを選び、既に利用中のBigQueryのデータセットを指定するだけです。小売業の製品ごとの売上や店舗ごとのトレンドのデータなど、詳細でペタバイト級の量がある情報でも、わずか数秒で接続し、分析を開始することが可能です。表計算ツールでのピボットテーブルや、グラフ化の手順に慣れている方であれば、いつもの同じ手順でデータの分析やグラフを用いた可視化ができるでしょう。

 BigQueryを利用するメリットはデータの解析や可視化だけではありません。既存の機械学習のモデルを利用して、企業データの分析や予測を行える点も挙げられます。この機械学習を利用した予測は Google スプレッドシート を入り口に利用できますので、データサイエンティストとして活躍される方を増やすことにもつながっていくでしょう。以下の図は、米国アイオワ州のある飲料の売上データの実績から、BigQueryの機械学習のモデルを利用して今後の売上トレンドを予測したものです。

 今回はAIの技術を使って簡単に、シンプルな集計から大規模分析まで可能な Google スプレッドシート を取り上げました。次回は、スライド作成ツールの紹介をしていきます!