重回帰分析とは?
エクセルでの手順・結果の見方もわかりやすくご紹介

重回帰分析とは

ビジネスにおいて、例えば「来月の売上はいくらになるのか」「売上に影響する要素は何か」といった問いに対する答えを求められるシーンは少なくないでしょう。しかし、このような問いに、明確な根拠をもって答えられないという方も多いのではないでしょうか。

マーケティング領域でよく用いられる多変量解析の一つである重回帰分析という手法を使えば、これらの問いに対して統計的な回答を導き出すことができます。
重回帰分析を理解し実施できるようになれば、どの要素が売上にどれくらい寄与しているか把握できるため、例えば「駅から徒歩でかかる時間が1分増えると売上が50万円少なくなる」といった推定ができるようになるのです。

そこでこの記事では、重回帰分析とはどのようなものなのか、どのようなシーンで活用できるのか、具体的な分析方法や注意点すべきポイントなどについてわかりやすく解説していきたいと思います。

関連記事:マーケティングに欠かせない因子分析とは?方法・活用・注意点・事例を解説
関連記事:売上分析は重要!6つのフレームワークを使って効率化しよう
関連記事:傾向分析とは?エクセルで売上の時系列データを読み解く方法

目次

重回帰分析とは2つ以上の何かを行うこと(説明変数)が、何らかの結果(目的変数)にどのような影響を及ぼすか、相関関係を数値化して予測することに活用される分析手法です。

例えば、売上を見るとき、商品の価格や品質といった要素が関係していることが推測できますが、売上を上げるためにどの要素がどれぐらい売上に影響しているのか把握できれば対策がスムースとなります。重回帰分析はこのように、売上の予測や顧客満足度の分析、ブランドのイメージ調査などに活用されています。

多変量解析_図3

説明変数が1つの場合を単回帰分析と呼び、2つ以上のものを重回帰分析と呼びます。
どちらも総称して回帰分析と呼びます。

例えば以下のような使用例が挙げられます。

単回帰分析は説明変数と目的変数がともに1つの変数を設定するため、原因と結果が一対一になっていると考えられるものに活用されます。

【使用事例】
・身長から体重を予測
・駅からの距離で賃貸価格を予測

重回帰分析の場合は、2つ以上の説明変数を設定し、目的変数に対してどれほどの影響があるかを数値で表します。

【使用事例】
・目的変数を「顧客満足度」、説明変数を「駅からの距離」「店員数」「面積」として、それぞれどれほど影響があるかを数値化して読み取ります。

多変量解析_図2

重回帰分析のビジネスにおける利用用途は、主に以下の2つの利用用途があります。
それぞれ解説していきます。

重回帰分析を用いて「結果」を説明変数から予測します。

【使用事例】
目的変数説明変数
売上予測・店舗面積
・広告費
・通行量
・店員数
売上予測2・提案数
・広告費
・値引率

重回帰分析で推定された係数の値から、各説明変数の影響度を測ることができるため、成果の要因を分析します。

【使用事例】
目的変数説明変数
顧客満足度・価格
・品揃え
・接客
・購入方法
ブランドイメージ・綺麗
・おしゃれ
・話題性
・高級感

重回帰分析を行う前に注意すべき4つの項目について解説していきます。

導き出したい結果が本当に重回帰分析で算出できるのか、考える必要があります。
重回帰分析はマーケティングで行われる多変量解析の分析手法の一つであり、他にも説明変数や目的変数の種類によってさまざまな分析方法があります。

多変量解析についてはこちら

重回帰分析はすべての変数を数値化する必要がありますが、例えばデータの中に質的変数(数値化が難しいもの)が含まれていた場合、一旦数値化させる工程を踏まなければなりません。
場合によっては他の多変量解析を活用した方が良い場合があるため、元となるデータを見て検討しましょう。

分析に活用する説明変数は、目的変数と相関性のある項目を厳選する必要があります。
重回帰分析に使用する説明変数はおおよそ5〜7個が目安とされています。
説明変数の選択方法の一つに、統計解析ソフトなどでステップワイズ法を活用する手もあります。

重回帰分析をより正確に行うためには、説明変数にあまり関連性がないほうがよいといった点が挙げられます。関連性が強いと、分析結果の解釈が読み取りづらくなるため、どちらか一方の変数を使うようにしましょう。

重回帰分析のメリット・デメリットについて解説します。

重回帰分析は、経営戦略や新規商品の販売戦略に活用することで、どれに注力すれば影響が大きく出るか予測が立つため、費用対効果の高いマーケティングが行えます。
また、営業でも、プレゼンなどで根拠を示すデータの作成にも有効です。

重回帰分析に活用するデータを、必要な要因かどうか見誤ると予測も正しく行えません。
ピックアップした説明変数以外に、大きな要因があるケースもあるかもしれません。
また、先にも説明したように、説明変数同士が強い関係性にあると、正しい分析ができません。そのため、抽出するデータや説明変数の選定が大事です。

重回帰分析の手順を説明します。
ここでは新規出店する飲食店の売上予測を例にして解説します。

最初の段階では、出来るだけ多くの説明変数を選出します。

・店舗面積
・座席数
・駅からの距離
・商圏人口
・半径15㎞圏内になある競合店舗数
・広告宣伝費
・通行量
・店員数
・メニュー数

説明変数が抽出できたら、その中からどの説明変数を使うか決めます。多くても7個程度に留めましょう。必要なデータを収集し、統計ソフトを活用して重回帰分析を行います。
誤差を伴う測定値の処理は「最小二乗法」を活用するなどして対処します。

【決定した説明変数】
・店舗面積
・座席数
・駅からの距離
・半径15㎞圏内になある競合店舗数
・広告宣伝費
・通行量

【統計ソフト】
・エクセルの分析ツール
・無料フリーウェア「R」
・有料ソフト「JMP」、SPSS

説明変数が確定したら実際に必要な数値を重回帰式に代入し、目的変数(結果)を算出します。

重回帰式

目的変数=(偏回帰係数×説明変数1)+(偏回帰係数×説明変数2)+(偏回帰係数×説明変数3)+…+定数項

新規店舗の売上予測 =(データの数値×店舗面積)+(データの数値×駅からの距離)+(データの数値×半径15km圏内にある競合店舗数)+(データの数値×広告宣伝費)+(データの数値×通行量)+定数項

重回帰式で求められた予測を、実際の施策に反映させます。

例えば、広告宣伝費がここでは大きく影響していることがわかれば、次年度の広告予算を上げてみるといったことが考えられます。

Excelで分析

Excelを利用した重回帰分析の方法について説明します。

「分析ツール」という機能を使えるようにするために、先ず初めに以下の工程を行います。

    【導入手順】
  1. 1. エクセルを開いた画面から「ファイル」を選択
  2. 2. 左端のバーから「オプション」を選択
  3. 3. 新しく開いたウィンドウで、「アドイン」→「設定」を選択
  4. 4. さらに開いたウィンドウで、「分析ツール」にチェックを付け「OK」をクリック、ソフトを一度閉じ再び開く

Excelに各データの数値を入力していきます。

・A列に分類を入力し、B列に目的変数、C列以降に説明変数を入力

・リボンの「データ」から「データ分析」を選択し、開いたダイアログで「回帰分析」を選択

YとXの範囲を指定します。

・入力Y範囲:分析対象の目的変数の範囲を指
・入力X範囲:説明変数の範囲を指定
・ラベル:上で指定した範囲にデータ名を含めた際はチェックを入れる
・出力オプション:分析結果の出力先を設定

出力された分析結果を確認します。確認するポイントは以下です。

・推定された回帰式の精度をチェック
・推定された回帰色が統計的に意味あるものかどうかをチェック(一般の水準に満たす数値かどうか)
・推定された係数が統計的に意味があるか
・各説明変数の影響度はどれくらいか

具体的に分析結果をみる方法については、次章で詳しく紹介します。

重回帰分析の分析結果の見方について解説します。

回帰式の精度を確認する方法は、“補正R2”の値を確認します。
0に近いほど低く、1に近いほど高い精度と判断できます。

回帰式の有意性をみるには“有意F”を確認します。
一般的に有意Fが0.05未満であれば、有用な回帰式を得られたと判断できます。

係数の有意性をみるには“P値”を確認します。
一般的にP値が0.05未満であれば、その説明変数は目的変数に対して「関係性がある」と判断できます。

説明変数の影響度をみるには、“t値”を確認します。
t値はそれぞれの説明変数が目的変数に与える影響の大きさを表し、絶対値が大きいほど影響が強いことを意味します。
目安としてt値の絶対値が2より小さい場合は、統計的にその説明変数は目的変数に影響しないと判断できます。

重回帰分析は考え方や工程から、少々難しい印象があるかもしれません。
しかし、少しでもこういった知識があれば、今後の戦略に活かすことができ、また何度も多角的に重回帰分析を行っていくことで成功率も高めていけることでしょう。
単なる思いつきで販促活動を行うのではなく、重回帰分析を取り入れ、コストパフォーマンスを高めていくことで事業の成功に繋がります。
ぜひビジネスに重回帰分析を取り入れてみてはいかがでしょうか。

現代は個々の消費スタイルの変化が激しい時代だとされています。企業が継続して利益を出すためには、顧客のニーズをきちんと把握することが大切です。
POSデータやIDレシートデータなどの情報を有効活用することで、マーケティングの精度を高められます。なかでも、IDレシートデータは顧客の性別・年代・属性など、個人の購買情報を横断的に得られることが魅力です。有効なデータ分析を行い、顧客の動向をしっかりと把握しましょう。

「IDレシートBIツール」の詳しい情報はこちらをご覧ください。

お問い合わせ

流通横断かつユーザ軸での貴社/競合ユーザ様の購買動向の違いが分かります。

詳細資料・サンプルレポートをご希望の方は、お気軽にお問い合わせください。