クロス集計の定義
クロス集計とは、複数の設問をかけ合わせて集計する方法です。たとえば、「利用結果に満足しているか」というアンケートをしたとします。この集計をする際「性別」「年代別」に分けて集計をするとより回答の傾向が細分化され、回答者のニーズが把握できます。
これに対し、1つの設問に対して設問を分けずに集計することを「単純集計」といいます。
単純集計の場合、1つの設問に対し、「満足」「やや満足」「不満」という内訳は分かっても、内訳の詳細は分かりません。クロス集計を行うと「満足」と答えた人のうち、性別の比率や年代の比率まで分かります。
クロス集計は、2つの設問をかけ合わせたものだけでなく、3つの設問、4つの設問を組み合わせが可能です。これを多重クロスといい、3つの設問が組み合わさっているものは3重クロス、4つの設問が組み合わさっているものを4重クロスといいます。
たとえば3重クロスの例として、「利用満足度」を「性別」と「年代」で集計する、4重クロスは、「利用満足度」を「性別」・「年代」・「使用頻度」で集計するなどが挙げられます。ただし、あまりに設問を多くしてしまうと答えが細分化しすぎてしまうので、注意しましょう。
関連記事:アンケートの作り方とは?回答率を高める方法も伝授
関連記事:アンケート結果を分析するには?集計や分析手法のいろはを解説
クロス集計を活用するメリット
クロス集計を活用すると、ひとつの調査結果からさまざまな側面を分析できます。そのため、調査結果を単に「数字」として見るだけでなく、「性別」や「年代別」に見ることで新しい需要を掘り起こしたり改善点を見つけられるでしょう。たとえば、あるイベントに対して満足度の調査をした結果、「満足」と「おおむね満足」が75%となりました。しかし、クロス集計をすると、男性の満足度が45%なのに対し、女性の満足度は30%だと分かったのです。女性の満足度が男性より低いと分かったことで、イベントで改善すべき点も見えてくるでしょう。また、年代別に満足度を集計してみても別の結果が見えてくるかもしれません。このほか、分析結果が数字により可視化されることで、一目で内容が理解しやすくなります。
クロス集計と単純集計!それぞれの集計表の違いを知ろう
では、クロス集計と単純集計がどのような違いがあるのか、実際に表を作成して説明します。たとえば、以下のようなアンケートを実施したと仮定しましょう。
①あなたの性別を教えてください
・男性
・女性
②あなたは、間食をしますか。
・毎日する
・週に5〜6日する
・週に3〜4回する
・週に1〜2回する
・まったくしない
単純集計表
この結果を単純計算表で表すと以下の通りです。
あなたの性別を教えてください
実数 | 比率 | |
---|---|---|
男性 | 300人 | 60% |
女性 | 200人 | 40% |
あなたは、間食をしますか。
実数 | 比率 | |
---|---|---|
毎日する | 50人 | 10% |
週に5〜6日する | 100人 | 20% |
週に3〜4回する | 150人 | 30% |
週に1〜2回する | 110人 | 22% |
まったくしない | 90人 | 18% |
単純計算表の場合それぞれの質問にどのくらいの人が答えたか、質問の回答比率や平均値を分かりやすく表すことが可能です。なお、単純集計を英訳すると「Grand Total」であるため、単純計算表は別名「GT表」とも呼ばれます。シンプルな単純計算表は調査の全体を把握するのに適しています。たとえば、「男性の方が回答数が多い」や、「間食を週に一度もしない人も18%いる」といったことが読み取れるでしょう。調査結果の内容を大まかに把握したいときに適した方法です。
クロス集計表
クロス集計では、どのような表にまとめられるのでしょうか。作成してみます。
「回答実数」
毎日する | 週に5~6回 | 週に3~4回 | 週に1~2回 | まったくしない | |
---|---|---|---|---|---|
全体 | 50人 | 100人 | 150人 | 110人 | 90人 |
男性 | 20人 | 30人 | 70人 | 70人 | 60人 |
女性 | 30人 | 70人 | 80人 | 40人 | 30人 |
「回答比率」
毎日する | 週に5~6回 | 週に3~4回 | 週に1~2回 | まったくしない | |
---|---|---|---|---|---|
全体 | 10% | 20% | 30% | 22% | 90人 |
男性 | 40% | 30% | 45% | 63.3% | 60% |
女性 | 60% | 70% | 55% | 37% | 40% |
このようにクロス集計であれば、単純計算表より結果を細かく分析できます。たとえば、毎日間食する人の60%は女性だが、週に3~4回間食をする人は、男女の比率がほぼ同じ、と分かるでしょう。しかし、クロス集計表だけを実施すると、ミクロな視点にしばられてしまい全体を把握できません。そのため、最初に単純集計表を作っておき、それをもとにクロス集計表を作り、分析したい内容によって使い分けたり比較したりするのがおすすめです。
クロス集計のやり方〜エクセル編〜
クロス集計は、データが多いほど行うメリットが大きくなる集計方法です。ここでは、エクセルの機能を使ってクロス集計を実施する方法を解説します。
たとえば、上記のような店舗別のカメラ売上をまとめたエクセルのデータがあったとします。これはサンプルなので単純な集計ですが、一般的にはより複雑な集計結果を用います。
手順①
クロス集計を行う場合はまず、クリック分析からテーブル(I)を選択しましょう。集計表を全て選択し、右下に現れたアイコンをクリックすると「テーブル(I)」を含む選択肢が現れます。
手順②
テーブル(I)からさらにテーブルを選択すると、ピボットテーブルのチェックフィールドが出ます。ここで、集計したい項目にチェックを入れましょう。
たとえば、「支店」と「コンデジ」にチェックを入れると、集計表から支店とコンデジがピックアップされて表示されます。
今回は、設問が少ない集計表を用いましたが、「ピポットテーブル機能」を使えば、大量の設問がある集計表でも、分析したい項目をピックアップして簡単にクロス集計表を作ることが可能です。もし手順①でアイコンが出てこなければ、集計表を全て選択した後に挿入の中にある「ピボットテーブル」をクリックすることで、同様に作成できるので試してみてください。
クロス集計で区別して覚えておきたい用語
クロス集計を作る場合、いくつか覚えておくと便利な用語があります。ここでは、クロス集計によく使われる用語の紹介と解説を行います。ぜひ、参考にしてください。
表頭と表側
表頭(ひょうとう)とは、表の1番上の横ラインを指します。オレンジ色に塗られた部分です。表側(ひょうそく)は縦ラインです。青色に塗られた部分を指します。クロス集計表では、設問項目を表頭と表側にそれぞれ当てはめ、両者に該当する回答実数などを明記します。
毎日する | 週に5~6回 | 週に3~4回 | 週に1~2回 | まったくしない | |
---|---|---|---|---|---|
全体 | 50人 | 100人 | 150人 | 110人 | 90人 |
男性 | 20人 | 30人 | 70人 | 70人 | 60人 |
女性 | 30人 | 70人 | 80人 | 40人 | 30人 |
Nとn
Nは調査対象全体の総数(母集団)です。たとえば、1,000人にアンケートをとった場合、Nは1,000と表されます。一方でnは、母集団から抽出した個数体の総数であり、母集団から15の個数体を取り出した場合、nは15と表されます。ちなみにNはサンプル数、nはサンプルサイズと呼ばれることもあるので、合わせて覚えておきましょう。
サンプル数とサンプルサイズ
クロス集計のサンプル数とは、「群数」や「標本数」を意味します。つまり、Nです。500人にアンケートを行った場合のサンプル数は500で、この数が多いほど大規模な調査といえます。一方サンプルサイズとは「各群のサイズ」であり、クロス集計ではnと同義語です。500人にアンケートを行い、それが女性350人、男性が150人だった場合、サンプルサイズはそれぞれ350と150で表されます。
クロス集計のサンプルサイズの決め方
クロス集計をはじめとする集計調査で、サンプルサイズを決めるとき「結果の精度」をどの程度に設定するかを基準にすることがあります。この基準のひとつとして「サンプリング誤差」を活用できます。たとえば、ある商品購入者を対象にアンケートを実施するとします。購入者全員にアンケートを実施するのが理想的ですが、時間などの制約から一部の人のみに実施できません。そのため「何人に調査したら、母集団を調査した時と同じような結果を得られるか」を判断する観点として「サンプリング誤差」を活用できます。より正確な集計を行う場合は、サンプリング誤差を小さくすることが大切です。
しかし、誤差を0にすることは難しいので集計をする前に「誤差を許す範囲」を決めます。これが最大許容範囲です。最大許容範囲がどのくらい信頼できるかを示した「信頼度」は%で表され、信頼度90%ならば「100回調査したら10回は間違った結果になる可能性がある」という意味です。なお、信頼度によって最大許容範囲は違います。なお、誤差を算出する「計算式」もありますが、統計学を学んでいないと理解するのは難しいでしょう。現在は、「誤差をできるだけ小さくするための自動計算ツール」などもネット上にアップされています。「クロス集計を行うので、できるだけ誤差の少なくなるように、サンプル数を決めたい」という場合は、自動計算ツールなどを利用してみましょう。
顧客のリアルな購買行動を把握するなら「IDレシートBIツール」
アンケートやクロス集計を使った市場調査は、もちろんマーケティングには欠かせませんが、よりリアルに顧客を知る方法のひとつに「レシートデータの活用」が挙げられます。レシートデータの魅力は、横断的に購買データを分析できる点です。具体的にはレシート1枚で、日付・時間・商品名及び金額(値引・単価・個数)・合計金額・電話番号、さらには購入した店舗のチェーン名・店舗名などの情報からユーザーのリアルな購買行動を把握できます。
「IDレシートBIツール」なら、消費者の購買や併買のデータを、店舗・カテゴリーを横断的に確認できます。膨大なデータを自社で集計・分析するには時間がかかるという場合に利用すると、効果測定の手間が大幅に短縮できるでしょう。また、同ツールでは、独自で構築した膨大なレシートデータから、コンビニエンスストア・スーパー・ドラッグストアなどの店舗別の売れ行きを可視化しています。POSデータでは見えづらかった自社商品の「買う人」と「買われ方」をしっかりと把握できるため、自社と競合商品の実売価格・売上が確認でき、顧客の理解だけではなく、商談時の資料としても利用可能です。
「IDレシートBIツール」の詳しい情報はこちらをご覧ください。
"IDレシートデータ"におけるクロス集計の活用事例
では、具体的に「クロス集計」を活用するのは、どのような場面なのでしょうか。
当サイトに掲載している"IDレシートデータ"活用事例から、そのポイントを紹介します。
購買データから考える「コンビニ冷凍食品」の価値分析
例えば、近年コンビニが「冷凍食品」に力を入れています。そこで、どのような属性の方が、どのように購入しているかを調べることで、「コンビニ冷凍食品」の価値を分析するレポート記事を作成しました。そこで活用した「クロス集計」の例をご確認ください。
■「同時併買比率」の男女比
下記のように「コンビニ冷凍食品」をどのような商品と一緒に購入しているかの「同時併買比率」を男女で比較するのに、クロス集計を利用しています。
コンビニ冷凍食品の時間帯別同時併買商品
■購入時間帯比較
また、売れ筋の「冷凍食品」が、どの時間帯に購買されているのかを確認するためにも、「クロス集計」は役立ちます。下記は、スーパーマーケットとコンビニで、冷凍食品の購買時間にどのような差があるのかを集計しています。
購入時間帯比較
■時間帯別のランキング比較
さらに、商品ごとに売れる時間帯の特徴があるかを調べるために、売れ筋商品の時間帯別のランキングを比較するグラフを作っています。下記のように、クロス集計で商品ごとの時間帯別ランキングを割り出し、その順位の変動をグラフで可視化すると、どの商品が、どの時間帯に伸びているのか、逆に減少しているのかが見えてきます。
「ファミリーマート」時間帯別の人気商品比較
▼"IDレシートデータ"では、帳票ファイルをCSVデータでダウンロードできるので、クロス集計など自由にデータの加工ができます。エクセルの「ピボットテーブル」を活用できるようになると、分析の幅が非常に増えますので、ぜひ活用してみてください。
分析レポートの詳細は、こちらをご覧ください。
購買データから考える「コンビニ冷凍食品」の価値とは?
▼また、その他のいろいろな視点での"IDレシートデータ"活用事例は、こちらをご覧ください。
“IDレシート”分析レポート
まとめ
この記事では、クロス集計の定義と行うメリット、単純計算表との違い、エクセルを使ったクロス集計表の作り方などを紹介しました。ネットを使って不特定多数にアンケートをはじめとする調査を行い、顧客のニーズを掘り起こすことは多くの企業が行っています。しかし、せっかく有効なデータを集めても活用しなければ、意味がありません。クロス集計は単純集計と異なり、集計結果を多数の面から活用できる集計表です。エクセルを使えば、集計表を作ることも簡単にできます。ぜひ、データの活用法として利用してみましょう。