多変量解析とは?
活用シーンや手順・使い分け方をわかりやすくご紹介

多変量解析とは

企業内でマーケティングを担当している方の中には、「多変量解析」と聞くと、難しそうな字面から何となく苦手意識を抱いてしまう方もいるかもしれません。
しかし、多変量解析はマーケターが最も意識すべき統計解析手法の考え方であり、概念を知ることで効果的なマーケティング施策を打ち出すことができるようになります

実はマーケティングにおいて、多変量解析を使う場合、数学的な理解よりも「多変量解析で何ができるのか」「どのような目的の場合にはどの手法を選ぶべきか」「分析データをどう解釈するか」といったことがより重要であると言えます。

そこでこの記事では、多変量解析の概要や、多変量解析でわかること、実施方法、多変量解析の種類・選択方法などについて、わかりやすく解説していきます。

「多変量解析」とは、複数の「変数」に関するデータをもとに、これらの変数間の相互関連を分析する統計的技法の総称をいいます。したがって、特定の分析方法ではなく、重回帰分析やクラスター分析といった、さまざまな分析方法が含まれます。

マーケティングにおいては、顧客データや売上データから、売上高を予測したり、顧客の特性をつかんだりすることに活用されています。

「多変量解析」で出てくるキーワードに、「変数」「目的変数」「説明変数」といったものがあります。

以下、例に挙げて説明します。

例えばある店で顧客ごとに1年間の売上データをとった場合、「購入回数」「購入金額」「購入点数」「店内の滞留時間」「年間の売上合計」などといったデータが「変数」に当たります。

そして、「年間売上合計」を「目的変数」として、これに影響を与えるものを「説明変数」、その「説明変数」とその因果関係を解き明かしていくのが「多変量解析」となります。

「購入点数」が「年間の売上合計」に関係あるかないかは、店の商品構成によって変わります。

個々の商品単価がほとんど同じであった場合、購入点数は重要な説明変数になりえますが、商品単価に大きな違いがある場合、ほとんど意味が無いと言えます。

次に、多変量解析でわかること、できることについて解説します。

統計学的には、「多くの情報を基にその関係性を解き明かす」手法として理解されていますが、ビジネスで活用する際には、「データを使って複雑な問題を解決すること」が求められます。

以下、具体例で説明します。

【チェーン店を展開する企業が、次の出店場所を決めたい場合】
地域の人口動態、地域のライバル店の売上高、地域住民の所得水準、土地価格、テナント賃料などのデータを使って多変量解析すると、理想的な場所に出店できるようになる。

【アンケートの結果から自社の強み・弱みを知りたい】
アンケート結果を多変量解析することで本当の強みが見える。

では、実際に多変量解析を行う際の手順について解説します。

多変量解析の目的は、「予測」と「要約」の2つがあります。

予測は、売上高・顧客数・客単価・商品別の売上といった過去からのデータ推移を分析し、将来の数値を予測するのが目的です。

要約は、消費者の商品購入決定における決め手や、市場の特性など、複雑でさまざまな要因が考えられるものに対して、わかりやすく単純化するのが目的です。

多変量解析は目的が「予測」か「要約」かで分析する手法が異なるため、解析を始める前に目的を明確にする必要があります。

まずは解析するデータを収集します。
だいたいデータはそのままでは使えないので、不要な箇所や重複している箇所を削除し、綺麗にします。

1変量解析とは、以下の作業を行うことです。

・外れ値(はずれち)の処理…正常値とみなすことができる範囲から大きく外れている値を解析対象から外します。
・異常値の処理…測定ミスなど、明らかに異常な値は解析対象から外します。
・図による分布状況確認…ヒストグラムや箱ひげ図を使って、資格的に外れ値や異常値を見つけます。

2変量解析は、2つのデータを同時に解析します。

通常、相関係数を求めて分析を行いますが、視覚化する散布図、クロス集計表もよく用いられます。

多変量解析を実施しますが、多変量解析にはさまざまな分析手法があります。
種類と選択方法については次章で解説します。

多変量解析の種類と使い分け

多変量解析の種類と使い分けについて解説します。

多変量解析で使用するデータは、4種類の「尺度」と呼ばれるグループに分けられます。

【量的データ(数値化できる)】
①間隔尺度
基準となる単位を用意して、差に意味を持たせた尺度

例)数値が2倍になっても2倍とは言えないデータ
気温、西暦など。

②比例尺度
絶対原点があり、比に意味を持たせた尺度

例)数値が2倍になれば2倍になったと言えるデータ
身長、睡眠時間など。

【質的データ(数値化できない)】
③名義尺度
単に各データを区別し、分類するための尺度

例)性別、住所などのデータ。

④順序尺度
順序や数値の大乗には意味を持たせたが、順序や数値の間隔が等しいとは限らない尺度

例)順位、検定の等級など。

多変量解析_図1

多変量解析にはさまざまな分析手法があります。
目的が「予測」か「要約」か、また、説明変数が「量的データ」か「質的データ」かによって分析手法を絞ることができます。

以下、それぞれ分析手法について簡単に紹介します。

【データを予測する場合】

判別分析
いくつかのグループやカテゴリに分かれているデータを元に、それらが「どういう基準で分けられたものか」という関係を解析することで、まだ分類されていないデータがどちらのグループに属するかを予測する手法です。

使用場面例:
・顧客の将来的な発注予測を立てる。
・アンケート結果等から回答者が製品AとBのどちらを選ぶかを予測する。その予測を元に販促に活用する。

パス解析
変数間にいつくかの因果モデルを仮定し、重回帰分析や共分散構造分析を応用して行う統計的分析です。因果関係のメカニズムを明らかにしたい場合に使用します。

使用場面例:
・広告出稿した際、その広告から購買行動という反応が得られた場合、広告という刺激に対して購買が生じる消費者の心理的な変容が発生していることを表す。


分散分析
1つまたは複数の因子の異なる水準が、特性値の平均にもたらす差の有無を調べる際に使う分析手法です。分散の分析ではなく、分散を用いた平均値の分析です。

使用場面例:
・20代、30代、40代、50代の4グループの可処分所得額の平均値差を検定する。


コンジョイント分析
最適な商品コンセプトを決定する際によく活用する分析方法で、個別の要素を評価するのではなく、商品全体の評価(全体効用値)することで、個々の要素の購買に影響する度合い(部分効用値)を算出します。

使用場面例:
・32インチのテレビが1インチ大きくなったら価格をいくらまで上げられるかなどというシミュレーションを行うケースで、同じ1インチでも32インチが1インチ大きくなるのと、50型が1インチ大きくなるのでは、1インチの価値が異なり、コンジョイント分析ではこのあたりを明確にする。


回帰分析
回帰分析とは、「何かを行うこと(説明変数)が何かの結果(被説明変数)にどのような影響を及ぼしたか」という因果関係を関数の形で明らかにする分析手法です。

使用場面例:
・「どのような機能を持った車だと高い価格設定ができるか」という問いを回帰分析する。まず価格に影響を与えそうな要素を洗い出し、関数を使って表す。例えば馬力が価格に与える影響はどれほどか調べるなど。


ロジスティック回帰分析
ロジスティック回帰分析は、いくつかの要因(説明変数)から「2値の結果(目的変数)」が起こる確率を説明・予測する分析方法です。2値とは、YESかNOといった、2つしか回答がないものを指します。

使用場面例:
・顧客がどのような理由で商品を購入するのか可能性を導き出す。
例えば、価格で購入する場合の可能性が何%かなど。

【データを要約する場合】

主成分分析
たくさんの量的な説明変数を、より少ない指標や合成変数(複数の変数が合体したもの)に要約する手法です。要約した合成変数のことを「主成分」と呼びます。

使用場面例:
・顧客満足度調査やブランドイメージ調査、利用者調査などのアンケート結果から、総合評価を出したり、顧客が重視する点を推測する。

因子分析
「因子」は何かの結果を引き起こす原因を意味します。たくさんの結果(変数)の背後に潜んでいる要因を明らかにするための分析です。

使用場面例:
・アンケート調査の結果から、回答者の「潜在意識」や「隠れた想い」を見いだす。

コレスポンデンス分析
アンケート調査などのクロス集計結果を散布図にして、見やすくする手法です。

使用場面例:
・ブランドイメージ調査から、競合と差別化するポイントを探る。

多次元尺度構成法
類似しているデータを、2次元あるいは3次元に配置し、視覚的に類似関係を把握するために利用される分析方法です。

使用場面例:
・競合調査やブルーオーシャン市場の開拓調査に活用。

クラスター分析
異なるものが混ざりあっている集団の中から、似たものを集めて集落(クラスター)を作り、対象を分類するという分析方法です。

使用場面例:
・菓子メーカーが、商品購入者をコンビニのロイヤルティ(購入頻度×金額)や特徴(直近購入がない)などによってクラスターを作成。クラスターごとに購入の増えている商品を分析することでコンビニでの売上アップの提案に活用。

現代は個々の消費スタイルの変化が激しい時代だとされています。企業が継続して利益を出すためには、顧客のニーズをきちんと把握することが大切です。
POSデータやIDレシートデータなどの情報を有効活用することで、マーケティングの精度を高められます。なかでも、IDレシートデータは顧客の性別・年代・属性など、個人の購買情報を横断的に得られることが魅力です。有効なデータ分析を行い、顧客の動向をしっかりと把握しましょう。

「多変量解析」というワードから、難しそうに感じるかもしれませんが、せっかく集まった貴重な顧客データやアンケート結果を、多角的に分析することで、確度の高いマーケティング戦略を行うことができるようになります。
また、ツールを使えば、数学的な計算をすることなく、分析結果が得られるサービスも多く存在しますので、ぜひ取り組んでみてはいかがでしょうか。

「IDレシートBIツール」の詳しい情報はこちらをご覧ください。

お問い合わせ

流通横断かつユーザ軸での貴社/競合ユーザ様の購買動向の違いが分かります。

詳細資料・サンプルレポートをご希望の方は、お気軽にお問い合わせください。