データ分析

データ分析とは?
4つの種類や目的、5つのステップでプロセスをご紹介

さまざまな業界が、データを分析してビジネスに使用する動きを加速させています。これまでデータはビジネスに欠かせないものでしたが、近年ではさらに重要になっています。では、なぜデータ分析がそれほど重要なのでしょうか。ここでは、データ分析の概要とメリット、データ分析の流れ、各業界で使用されているデータについて説明します。

マーケティング戦略や経営戦略において、今やデータ分析は欠かすことができません。データ分析は、膨大なデータを分析してビジネスに反映させることで、さまざまな業界でデータに基づく経営判断やより効果的なビジネスの意思決定をすることを目的として活用されています。

しかしながら、データ分析という名称は聞いたことがあっても、何をどのように分析するのか、どのように経営戦略に活かせば良いのかよくわからないという方も多いのではないでしょうか。

そこでこの記事では、データ分析とはどのような目的で行うのか、具体的な分析方法や分析フローをわかりやすく解説していきたいと思います。

さまざまな業界が、データを分析してビジネスに使用する動きを加速させています。これまでデータはビジネスに欠かせないものでしたが、近年ではさらに重要になっています。では、なぜデータ分析がそれほど重要なのでしょうか。ここでは、データ分析の概要とメリット、データ分析の流れ、各業界で使用されているデータについて説明します。

データ分析の具体的な方法を説明します。

①頻度分析とヒストグラム


データ分析_図1

頻度分析とは、特定のルールに従ってデータを整理し、データの中心となる値の種類とその変化を理解することです。
一方、履歴グラフは、変動の分布(度数分布)を示す棒グラフであり、「箱ひげ図」です。 たとえば、1時間あたりの平均顧客単価を計算してグラフに表示することにより、平均顧客単価がピークに達するタイムゾーンを視覚的に確認できます。

②サンプル調査とサンプル平均

サンプリングは、大量のデータからランダムに抽出して観測した場合に、仮説検定の概念に基づく統計的推定方法です。
一方、標本平均は、標本調査から得られた情報から母集団の傾向で、母集団の平均を推定します。
例えば、市内に住むすべての人を対象にアンケート調査を行います。さらに、市内のすべての居住者の平均値を推定することができます。

③相関


データ分析_図2

相関は、一方の値が変化し、もう一方の値が変化する2つの値の間の関係を表します。「正の相関」の場合、2つのデータの一方が増加すると、もう一方も増加します。「負の相関」の場合、2つのデータの一方が増加すると、もう一方は減少します。
この相関関係は、例えば、顧客へのサービス満足度調査を実施する際には、調査結果から満足度との相関が強い項目を把握することで、満足度向上に必要なアクション項目を見積もることができます。

④回帰分析と重回帰分析


データ分析_図3

回帰分析は、統計的手法を用いて「因果的数値」と「結果的数値」の関係を調査します。これにより、仮説を立て、イベント発生の関連性を理解することができます。
一方、重回帰分析は、複数の説明変数を使用して1つの目的変数を予測しようとする統計手法です。 たとえば、プールの訪問者を調査する場合、回帰分析では、温度が上昇するとプールの訪問者数が増加するという仮説に基づいて、温度と訪問者数の関係を調査します。

データ分析において、目的を明確に定めて、その目的に対する仮説を立てて検証することがポイントです。


  • 事実を基に意思決定を下す
    データ分析の最大の目的は、適切な意思決定をすることですが、データに基づいていることです。

  • 仮説検証して意思決定の精度を高める
    データ分析では仮説を立てて、何か課題が発生したときは、その課題の原因の仮説を立てた上で、課題の解決に繋がるのです。
    データ分析を行うことで問題解決をスピーディーに行う。

実際にデータ分析を実行するための5つの標準プロセスがあります。ツールやデータを扱うためには、事前にこれらのことを知っておく必要があります。以下のステップバイステップでそれらを見てみましょう。

まず、分析の目的を明確にします。データの意味とその背後にある状況に基づいて、「なぜなぜ分析する」などのポリシーを決定します。現在の問題を明確にすれば、分析したい目的がわかるはずです。ただし、最初から明確な目的がない場合は、少なくとも「分析で何をしたいのか」に備えてください。データ分析は、目標を達成するための単なる方法であることに注意してください。

分析上の問題を見つけ、課題を特定します。分析の目的を明確にした後、その目的を達成するために必要な「解決すべき課題」を見つけます。目的設定では「やりたいこと」に基づいていましたが、分析タスクでは「知りたいこと」を調査します。これは非常に重要なプロセスです。
また、この「課題」は、分析が進むにつれて変わることがよくあります。それでも、分析の目的を他のメンバーと共有し、全員と課題を更新する必要があります。
次に、「真か偽かを問わず、最も可能性の高い答え」、つまり課題や仮説が特定され、データ分析が実行されて検証されます。要因を推測して仮説を立ててデータを分析することで、より正確な結果を期待できます。ただし、問題が多い場合は、優先順位を付け、優先順位に従って検証し、データを分析します。

データを収集します。この時点で、最終的に次のステップに進みます。明確化された「分析目的」や「解決したい問題(仮説)」を意識しつつ、必要と思われるデータを収集します。その際、対象、時間、フォーマットなどのデータ型や条件に注意を払えば、その後の処理をスムーズに行うことができます。

参考:アンケート調査の調査方法や内容、主な例などを紹介!
参考:POSデータの活用方法とPOSデータに足りないものをご紹介します

データの処理と分析を行います。さまざまなシステムから収集された膨大な量で、さらには無関係なデータがあることに気付くかもしれません。ただし、放置して分析を進めると、集計や分析に時間がかかり、結果が不明確になる場合があります。そこで、データ分析を開始する前に、いくつかのデータ前処理が必要です。

この前処理は「データクレンジング」と呼ばれ、データ分析において最も時間と労力を要するプロセスであると言われています。実際、総務省が作成した「ICTスキル総合学習資料」によると、データサイエンティストの約53%が「データの前処理に最も時間がかかった」と回答しています。 具体的なデータ前処理方法としては、まずアタリの情報を利用して、検討したロジックで処理が完了できるかどうかを確認します。次に、より効果的な分析方法とデータ型を選択することをお勧めします。

適切なデータクレンジングの後、「Tableau」や「PowerBI」などの「BI(ビジネスインテリジェンス)ツール」と呼ばれる分析ツールを使用して分析を練習し、一目で視覚化します。データ分析には、「クラスター分析」や「RFM分析」など、さまざまな方法やフレームワークがあります。分析の目的や使い方に応じて、最適な方法を選びましょう。

最近では、クレンジング済のデータをあらかじめ搭載した安価な分析ツールもあります。「IDレシートBIツール」など、市場の購買分析を簡単にはじめられるサービスもあります。

分析結果をビジネスに活用しましょう。先に述べたように、データ分析は単なる手段です。
得られた結果を期待したかどうかにかかわらず、「なぜ得られたのか」「次に何をすべきか」を考え、実際に行動しなければなりません。データ分析が役立ちます。ただし、必要と思われるデータを収集しても、100%カバーすることは事実上難しいため、想定できる他の要素も含めて、次の行動につなげる姿勢をとることが重要です。

また、結果から導き出された考察に基づいて複数の対策パターンを計画し、次の分析タイミングで分析軸として再利用することも可能です。このように、データ解析では、「目的・課題設定」「分析」「改善」を1サイクルで何度も繰り返すことで、スピーディーなPDCAが可能になり、事業の成長が期待できます。

課題の特定

データの分析を考えるとき、ほとんどの人が最初に考えるのは、数値的に処理できるデータがあるかどうかです。メリットがたくさんあります。
ただし、誤った分析を行う可能性があります。それを定量化することによって失われるいくつかの情報もあります。

データを処理する場合、センサーなどを使用してコンピューターが取得した値は、最近では、温度、湿度、明るさ、体積など多くのセンサーが使用されています。また、事業所が商品の数量や数量などの数値を入力することは珍しくありません。

それだけでなく、通常使用するあいまいな単語を説明するために数字を使用することもあります。たとえば、「背が高い」「スキーによく行く」という言葉を聞くと、人によって印象が異なります。 「背が高い」という言葉は、男性か女性か、子供か大人かによって異なります。ただし、「身長は188cm」などの数字を使って聞いた人の印象は同じです。

同様に、「多く」という言葉は、人によって印象が異なります。スキーをしない人にとっては、年に5回行くのは多いかもしれませんし、毎週スキーをする人にとっては、20回はそれほど多くないように思えるかもしれません。 このように、短時間で正確に伝えることができます。

定量化について、たとえば電車の乗車率が200%であるというニュースがあるとします。デジタル化すれば伝えやすいのですが、現場にいなければ混雑度は感じられません。大人が多い状況と子供が多い状況では雰囲気が異なり、トラブルにより混雑する場合があります。
これがライブ音楽会場になると、状況はさらに変化します。同人数の方でも、演奏や賑やかさは違和感はありませんが、開場時間が遅れて待っていると不満を感じます。効率的に定量化して処理することは重要ですが、それを直接体験することも重要です。人間であるため、感情は人によって異なり、データでは見ることのできない雰囲気は感情でしか伝えられません。

データ分析を効果的に活用するためのポイントを整理しました。

データ分析の目的は、「より良いビジネス上の意思決定を行うこと」です。ビジネスは、大小を問わず、一連の選択(決定)です。そのような決定の蓄積は、会社の評判、利益、顧客満足度などの成長につながります。データを分析して、各決定が可能な限りスムーズかつ成功するよう、明確な目的を持ってデータ分析に取り組みましょう。
また、目的がはっきりしないデータを分析すると結果は出ますが、蓋を開けると分析結果がビジネスにつながらない可能性があります。
そのため、まずは「なぜデータを分析したいのか」「データ分析の結果、どのような世界を見たいのか」などの目的や目標を検討することをお勧めします。

データを操作するには、データ自体を正しく理解するという客観的な視点を持ち、知識も必要です。分析するデータを理解しないと、そもそも分析も結果も使えません。
データを理解することは、データを活用するために不可欠です。会社が直面している問題を発見するために、データの種類、内容、特性、および意味を理解せずに、全体像を想像したり、詳細を抽出したりすることはできません。その場合、問題の背景を理解し、適切な分析方法を選択することは不可能です。まず、分析の目的を明確にし、分析方法を選択できるように、常にデータの理解を深めることが重要です。
特に、個人情報を含むデータを取り扱う場合は、その取り扱い方法や個人情報保護法等の法令を理解する必要があります。個人情報の不適切な取り扱いは、外部からの批判を招き、企業活動の継続を妨げる可能性があります。

SWOT分析は確かに「S=強さ」、「W =弱さ」、「O =機会」、「T =脅威」であるため、この順序で考える人もいます。多くの場所を経験したこの世界の専門家の立場から、その順序で進むことに同意しません。その理由は、最初に内部要因に言及するよりも、最初に「外部環境」を検討する方が適切であり、後でより適切になるためです。前述のように、「機会」に対して「強み」を打ちます。 「強さ」に対して「機会」を打つことはありません。
「強み」を「機会」にぶつけることで、市場の動きに貢献する同社の「強み」は「積極的な戦略」に導かれるので、基本的には「マーケットイン(お客様の利便性)」の考え方です。
これが会社の「強み」と一致する「機会」を見つけた場合、それはかなり制限され、「製品アウト(メーカーの利便性)」の感覚を与える可能性があります。
したがって、考慮の基本的な順序は次のとおりです。
まず、「脅威」…環境の悪さについて多くのことを話し合うのは意味がないので、短時間で。
第二に、「機会」…それが最も重要なポイントですので、時間をかけて時間をかけてください。
第三に、「強み」…「機会」に利用できる潜在的かつ実際の「強み」は、時間の経過とともにさまざまな方向からとらえられます。
第四に、「弱点」…弱点は誰にでも知られているので、あまり時間はかかりません。
特に、「機会」と「強み」が隣り合っているのがコツです。ここで多くの時間を過ごします。つまり、「積極的な戦略」だけを考えているのなら、「機会」と「強さ」だけを考えればいいのです。最近は「機会」と「強み」を十分に発揮しており、「脅威」と「弱み」に時間を割いて申し訳ありません。次に、「機会」が1番目、「強さ」が2番目、「脅威」が3番目、「弱さ」が4番目の順序になります。

「クロス集計表」は、現在の状況と質的変数間の関係を示しています。2つの変数が両方とも定性変数である場合は、「クロス集計」を使用して関係を明確にします。
クロス集計表の例としては、メンバー顧客の「特定の商品を購入した/購入しなかった人」と「その商品の割引クーポンを使用した/使用しなかった人」の関係を確認したい場合は、分割表を使用してください。
また、クロステーブルは、数値表で現状を把握したい場合によく使用されます。

「データを使うことはビジネスの成功につながる」と言っても想像しにくいかもしれません。そこで、実際にデータの活用に成功した企業の例を紹介します。

導入事例:味の素冷凍食品株式会社様

富士通農業のベストプラクティスを共有する
富士通が提供する農業経営支援サービスをご存知ですか? 2012年の発売以来、地方自治体、JA、農業生産者等に導入されている経営支援サービスです。
このサービスの特徴は、ベストプラクティスの共有です。農業における仕事の成果や環境などのデータを収集・分析し、最良の成果を上げた成果を活用しています。
また、施設園芸のコスト削減も実現しました。気象データを含むセンサーから取得した複数のデータの組み合わせを分析し、収量などを予測し、リーン温室運転を実現しました。

パナソニック/営業活動の可視化と業務効率の向上
パナソニックは外部データ分析ツールを導入し、営業部門でDXに成功しました。これまで、「プロジェクトの状況をスムーズに把握できない」「情報を共有するのに時間がかかる」「顧客情報を正確に管理できない」などの問題がありました。これらの問題を解決するために、ツールを導入し、データの活用に取り組みました。
ツール導入の効果が明確に示され、営業活動の可視化が実現しました。以前は他部門の動向がわかりづらく、連携もうまくいきませんでしたが、情報共有が容易になった結果、総合的な提案がしやすくなりました。
また、ツールのタイムライン機能を利用することで、親しみやすいコミュニケーションも実現しています。コミュニケーションが容易で、情報共有の円滑化に貢献できる環境を構築できます。また、プロジェクト情報をリアルタイムで把握できるため、運用効率が向上しています。

現代は個々の消費スタイルの変化が激しい時代だとされています。企業が継続して利益を出すためには、顧客のニーズをきちんと把握することが大切です。
POSデータやIDレシートデータなどの情報を有効活用することで、マーケティングの精度を高められます。なかでも、IDレシートデータは顧客の性別・年代・属性など、個人の購買情報を横断的に得られることが魅力です。有効なデータ分析を行い、顧客の動向をしっかりと把握しましょう。

それでは具体的に「IDレシートデータ」から、どのような分析が可能なのか、実際の分析事例を紹介しましょう。

「IDレシートデータ」の分析レポート記事では、コンビニ冷凍食品の購買データからわかった魅力や価値について分析した記事があります。その一部をご紹介します。

冷凍食品を購入する場合、コンビニだけでなくスーパーマーケットでの購入も主要な購入店舗となります。同じ「冷凍食品」を購入するのに、「コンビニ」と「スーパーマーケット」では、利用者属性はどのように異なるのかを調べました。


コンビニとスーパーマーケット冷凍食品購入者層の差


「コンビニ」での冷凍食品購入者は、男性が3ポイント、未婚者が8ポイント、子無しが5ポイント「スーパーマーケット」より高くなっています。スーパーマーケットでは、「家族ための冷凍食品購入」というニュアンスが強く、コンビニでは、「個人や仲間との冷凍食品購入」というニュアンスに変わるようにも感じられます。

では、購入される曜日や時間帯に違いはあるのでしょうか。
「コンビニ」と「スーパーマーケット」の、冷食購入曜日や時間帯を比較してみました。


購入曜日比較


週末の土日は、「スーパーマーケット」での冷凍食品購入割合が高くなっており、「コンビニ」の冷凍食品は、月曜日は弱いものの平日が強いことが分かります。


購入時間帯比較


続いて、購入時間帯を比較してみました。
平日のコンビニでの冷凍食品購入者は、「ランチタイム」の11~12時は突出して高く、「帰社・残業時間帯」の17~19時も高いことが分かります。一方休日になると、コンビニでの冷凍食品購入者は、朝6~7時が高くなっています。その他の時間は突出した時間はないものの9~13時と19時が伸びてきます。

では、実際にコンビニ冷凍食品の売れ筋商品は、どのようなものがあるのでしょうか。
時間帯や立地も加味して各社分析してみると、コンビニ各社の特徴が見えてきました。

まずは、休日朝のセブンイレブンの売れ筋冷食を、都心店と郊外店で比較しました。


セブンイレブン「休日朝」の都心店舗/郊外店舗の購入数TOP10


休日に人気が上昇しているのが『冷凍フルーツ』です。
「都心店舗」では、1位に「パイナップル」、2位に「アップルマンゴー」、6位に「ブルーベリー」がランクインしています。一方「郊外店舗」では、平日にはTOP10にはひとつも入っていなかったものの、「ブルーベリー」が1位となっています。セブンイレブンの「朝」には、『冷凍フルーツ』の需要が高いことが分かります。

続いて、ローソンの「ランチタイム」における都心/郊外の売れ筋商品の違いを見てみましょう。


ローソン「平日昼」の都心店舗/郊外店舗の購入数TOP10


ローソン「休日昼」の都心店舗/郊外店舗の購入数TOP10


左側、都心店舗の表を縦に比較してみると、『冷凍パスタ』(黄色いマーカー)の変化が特徴的です。平日には3商品がランクインしているのに、休日はひとつもありません。一方右側の「郊外店舗」は、平日に1商品、休日に2商品となっており、休日に増えていることが分かります。都心店舗では、オフィスのランチ需要で冷凍パスタが人気という傾向が見えてきました。

最後、ファミリーマートの冷食では、休日夜に特徴が見えました。


ファミリーマート「休日夜」の都心店舗/郊外店舗の購入数TOP10


『お惣菜』の『お母さん食堂』シーズ(黄色いマーカー)が人気となっています。特に赤枠で囲んだ「野菜系」の『お母さん食堂』シーズは、「郊外店舗」よりも「都心店舗」で上位となり、都心/郊外問わずに平日より休日に需要が高まっていることが分かります。ファミリーマートでは、 “家族に喜んでもらう”という「ファミマル」ブランドのコンセプトで取り組んでいるため、『お惣菜』の冷食が人気になっているようです。

その他、様々な視点で分析した結果は、下記のレポート記事をご確認ください。
購買データから考える「コンビニ冷凍食品」の価値とは?

このように、公開しているIDレシートデータの分析レポートでは、様々な視点での分析例が掲載されています。マーケティングにおけるデータ分析のヒントとして、ぜひご活用ください。

"IDレシートデータ"活用事例は、こちらをご覧ください。
“IDレシート”分析レポート

以上、データ分析はどのような目的で行うのか、具体的な分析方法や分析フローをご紹介しました。これまでデータはビジネスに欠かせないものでしたが、さまざまな業界が、データを分析してビジネスに使用する動きを加速させています。

膨大なデータを分析してビジネスに反映させ、データに基づく経営判断やより効果的なビジネスの意思決定に活用しましょう。

「IDレシートBIツール」の詳しい情報はこちらをご覧ください。

お問い合わせ

流通横断かつユーザ軸での貴社/競合ユーザ様の購買動向の違いが分かります。

詳細資料・サンプルレポートをご希望の方は、お気軽にお問い合わせください。