ビジネスに関わる人全員が
データのリテラシーを身に付けるべき
Data Scientist Society
データ分析を担う人材として「データサイエンティスト」への期待が高まっている。しかしデータサイエンティストという職種について、従来は定義があいまいだった。そこでデータサイエンティスト協会が設立され、データサイエンティストに求められるスキルの要件や知識レベルについて定義し、その認定が行われている。では、データサイエンティストとして認められるにはどのようなスキルや知識レベルが必要なのだろうか。
スキルチェックリストを公開して
データサイエンティストのスキルを定義
一般社団法人データサイエンティスト協会(以下、データサイエンティスト協会)が設立されたのは約10年前の2013年。同協会では新しい職種であるデータサイエンティストに求められるスキルの要件や知識レベルについて定義し、スキルチェックリストとして2015年より公開している。同協会でデータサイエンティストに求められるスキルを定義するスキル定義委員の高橋範光氏は、データサイエンティストに求められるスキルや知識が激しく変化することを指摘する。
高橋氏は「スキルチェックリストは2015年に公開して、これまで3回内容を更改して現在はバージョン4となっています」と説明する。高橋氏によると内容を公開するごとに50個ほどの新しいスキルが増えているという。また、従来は難易度が高かったスキルのレベルが下がり、簡単にできるようになる傾向もあるという。
その理由について高橋氏は「ツールやテクノロジーの進化によって、従来は難しかったことが簡単に実現できるようになるスキルが増えています。例えばAIは、すぐに使えるものが世の中に広く出回っています。一方で上位のスキルについては新しいスキルが多く生まれ、その習得が必要になります」と話す。
データサイエンティスト協会ではデータサイエンティスト検定(DS検定)を実施して、データサイエンティストのスキルや知識レベルを認定している。高橋氏は「DS検定には、いつ取得したのかが記載されています。とても変化の激しい分野ですから、DS検定を取得した後もスキルや知識をアップデートする必要があります」と説明する。
このDS検定を取得するにはどのような方法があるのだろうか。データサイエンティスト協会のホームページにはDS検定取得の対策講座の情報が提供されている。高橋氏はディジタルグロースアカデミアの代表取締役社長も務めており、同社では企業向けDX人材育成や研修およびeラーニングなどの事業を展開し、DS検定取得に向けた対策講座も実施している。
データ活用に向けた二つの取り組み
人材が活躍できる環境の醸成と整備
データ活用に向けて二つの取り組みが重要だと指摘する。データサイエンティストには四つのスキルレベルがあり、その入門となるのが「アシスタント データサイエンティスト」で、データサイエンティスト協会のホームページでは「見習いレベル」と説明されている。
高橋氏は「仕事においてデータを触らない人はいないと思います。例えばデータの平均だけを見て判断するのは危険で、本来は偏りがあるものです。こういったことを理解した上でデータから試算を出さなければなりません。こうした感覚を知ることがアシスタント データサイエンティストであり、これはビジネスに関わる人、全員が知っておいて共通言語化するべきです。こうしたことを特定の誰かに任せるとDXは進みません」と強調する。
またアシスタント データサイエンティストの見習いレベルのリテラシーが会社に根付かなければ、データサイエンティストが活躍できないとも指摘する。高橋氏は「社内のリテラシーが低いと、データサイエンティストのスキルを持つ人が浮いてしまい活躍できずに転職してしまいます。これは企業にとって大きな損失であり、その人材が海外に活躍の場を探しに行ってしまうと日本の発展にも悪影響が生じます。我々は『1億総データサイエンティスト』と言っていますが、会社の全員がデータに関する最低限の知識を身に付けて裾野を底上げすることも大切です」と説明する。
もう一つはスキルを使える環境を用意することだという。現在、データサイエンティストを育成するための研修など学習環境が整ってきている。しかし講座を受講して知識を習得した人が会社に戻ると、その知識を生かす環境が用意されていないケースが多いという。
高橋氏は「例えば一部の管理者しかデータにアクセスできない、データを活用するのに申請が必要で何日もかかる、クラウドで便利なツールが提供されているのに情報漏えいが心配で使わせてくれない、こうした状況だとせっかく身に付けた知識を試すことができず、スキルアップも図れません。サンドボックスやプレイグラウンドといった場を用意して、可能な範囲で自由に使わせることでスキルが伸びてデータ活用の効果が高まり、DXが加速するのです」と説明する。
データそのものの価値の見直しと
既存のKPIを顧客の視点で見直す
データの活用についてツール依存のことを学ぶのではなく、本質を理解することも大切だという。その本質について高橋氏は高級サラダチェーン店「クリスプ・サラダワークス」を運営するCRISPのデータ活用の事例を挙げる。同社は「CRISP METRICS」と呼ばれるサイトにおいて、同社のKPIに設定している売り上げや客数などをリアルタイムで一般に公開している。こうしたデータは一般的には社外秘だが、CRISPは業績に関するデータを積極的に公開している。
高橋氏は「よく行く店がいつの間にか閉店していたということがあります。お気に入りの店ならば、業績が悪くなっていることが分かれば応援しようという気持ちになり、売り上げに貢献したくなります。CRISPはその心理を活用して、データを公開することでファンを増やす試みをしているのではないでしょうか」と解説する。
また、データ活用において既存のKPIを疑うことも重要だという。高橋氏は機械工具などの工場用副資材を提供するトラスコ中山の事例を挙げて説明する。同社では従来、「在庫回転率」をKPIに設定していた。これは良く売れる商品の在庫を持ち、売れない商品の在庫は持たないという発想だが、同社の中山哲也社長は「在庫回転率は顧客目線ではない。在庫回転率を見てデータ分析しているのはおかしい」と考え、新たに「在庫ヒット率」というKPIを設定した。これは顧客から問い合わせがあったときに、どれだけ商品を即納できたかを計る指標だ。
高橋氏は「複雑な統計解析やAIの活用などがトレンドであり、新しいことをすることも大切ですが、顧客の視点で既存のKPIを疑ってかかり、データの真の価値、新たな価値を知ることがデータサイエンスでは重要です」とアドバイスする。
高級サラダチェーン店「クリスプ・サラダワークス」を運営するCRISPが公開する「CRISP METRICS」の画面。同社がKPIに設定している売り上げや客数などをリアルタイムで一般に公開している。
DXの推進に必須となる
データ人材の育成の仕方
Data Science School
データサイエンティストの役割が重要になる中で、その人材不足が危惧されている。そこで期待されているのがデータサイエンスに関する教育や研修を提供する企業の役割だ。ここで紹介するデータミックスはビッグデータやAI、機械学習をはじめとするデータサイエンスに関わる教育や研修事業を展開する、データサイエンススクールだ。同社が提供するカリキュラムや、これから必要とされるデータ人材の姿などについて話を伺った。
データに問いかけて
占い師から抜け出す
データミックスの代表取締役社長を務める堅田洋資氏は大学で統計学を学び、データサイエンスを学びに米国に留学した経験を持つ。2017年に同社を創業した理由について堅田氏は「日本にはデータサイエンスを学ぶ場が非常に限られており、そこに危機感を持ちました」と説明する。同社の受講生はこれまで約1,000名で、毎年200名から300名の卒業生を輩出している。
受講生の傾向について、意外にも非エンジニアが6割強を占めるという。業種としては当初はコンサルタントや金融、SIerが多く、顧客のDXを支援する目的で受講する生徒が多かったという。しかし現在はソフトウェアが多く、それに次いでメーカーや金融、コンサルタント、マスコミと続く。こうした傾向が示す通りデータ分析のニーズがビジネスの現場に広がっていると言える。そして堅田氏はデータ分析の重要性について次のように指摘する。
「物価や為替の変化、地政学リスク、顧客はオンラインとオフラインが入り乱れる複雑かつ予測できない変化が多い中で、次に何をすべきかについて、これだ、と言える人は占い師でしかありません」(堅田氏)
つまり今何が売れていて、顧客がどのくらいいて、どのような顧客が伸びて単価が上がっているのかなど、こうした情報を把握していなければ次の有効な一手を打つことはできない。
堅田氏は「ビジネスに関わるならば何らかのデータを使う必要があります。しかしデータは無口な友達なので、問いかけなければ何も教えてくれません。ただし問いかけるだけではなく、PythonやR、SQLといった情報を取り出す技術を習得する必要があります。取り出した情報を読み解くには自身のビジネスを理解する必要もあります。客単価が1万円だと言われて、それが安いのか高いのかを知らなければ判断できません」と説明する。
そして「実際にビジネスをしている人がデータの塊に対して問いかけて、必要なデータを取り出す作業ができて、それを読み解く、この連動ができないと占い師から抜け出せません」と指摘する。
テクノロジー単体ではなく連動性
対面授業による自由な議論も必要
統計解析やプログラミングの知識を持たない人がデータサイエンティストになるまで、どのくらいの時間がかかるのだろうか。データミックスでは大きく三つの講座が実施されている。Excelを利用したデータ解析を学ぶ「ゼロから始めるExcelデータ分析・統計学講座」と、データサイエンスの本質を学ぶ「データサイエンス基礎講座」、そしてデータサイエンティストを養成する「データサイエンティスト育成コース本講座」の三つだ。
いずれの講座もオンラインとオフラインを組み合わせたハイブリッドスタイルで実施されており、Excelデータ分析・統計学講座は6週間、データサイエンス基礎講座は8週間、データサイエンティスト育成コース本講座は7カ月の受講期間となっている。
堅田氏は「データサイエンティスト育成コース本講座で時間を使って学習してくれる方は、7カ月で一定レベルのスキルを習得できています」と説明する。ただしデータサイエンスにおいて重要なのは、いろいろなことに興味を持って視野を広げることだという。
堅田氏は「世界で何が起こっているのか、その本質は何かというふうに、視野を広げて興味を持つことでデータが集まってきます。集めてきたデータを分析して、この問題や課題はこういう構造だったのかと理解し、そこから解決策のアイデアを得る、こうした連動性を意識してカリキュラムを作っています」と説明する。
また「プログラミングを学びたい、AIを学びたいというのならば、書籍で学ぶこともできますし、eラーニングで手軽に受講することもできます。データ分析を学びたいのならばプログラミングやAIなど、テクノロジーやテクニックの連動性を理解するとともに、対面での授業も必要です。当社では50名から60名で1クラスとしており、対面の授業を交えることで横のつながりができます。データ分析には正解がないので、生徒同士で対話したり議論したりして視野を広げることが効果的です」と強調する。
必要なデータ人材とは何か
データ活用に明確な意思を持つ
DXの推進および取り組みの加速においてデータサイエンティストが重要な役割を担うことは間違いないだろう。ではどのようなデータサイエンティストが必要なのだろうか。堅田氏は「データサイエンティストが本当に必要なのか」と問う。そして「イメージしているデータサイエンティストとは何かと問いかけると、答えが返ってこないケースが少なくありません」と指摘する。
レベルの高いデータサイエンティストの育成だけではなく、企業ならば社員のデータリテラシーを高めることも重要となる。複雑な数理やプログラミングができなくても、市場には多くのツールが出回っており、それらを活用すればデータを分析してビジネスに生かすことはそれほど難しいことではない。
その際に自分は何を知りたいのかを明確にして、ツールを使ってデータに問いかけて必要なデータを取り出し、集計して可視化する、このサイクルを適切に回せるリテラシーは誰しも持っておくべきだろう。
堅田氏は「このレベルのリテラシーを目指すのか、それとも統計学もAIも理解して、複雑なデータを処理できるスキルを身に付けるのか、どのレベルで人材を育成しようとしているのか、ここがあいまいになっているケースが多く見られます。なんとなくデータサイエンス、なんとなくデータドリブン経営ではなく、ここに明確な意思を持つことが重要です」とアドバイスする。最後に堅田氏は「社員の思考ロジックをデータサイエンス思考に変えていくだけでも、実務に成果をもたらせます。データサイエンティストを社内に多く育成するのはハードルが高いので、当社のデータサイエンス基礎講座で社員の思考ロジックを変えることをお勧めします」と語った。