クロス集計とは?集計表やエクセルで作成する方法を紹介

クロス集計とは?
集計表やエクセルで作成する方法を紹介

近年、ネットを利用してアンケートやリサーチを行う企業が増えています。顧客以外からも広く意見を集めることで、商品開発や企画などに役立てることが可能です。しかし、いくら大量にデータを集めても、集計がいいかげんでは役立ちません。多数のサンプルを集計するために、よく用いられるのがクロス集計です。ビジネス関連の本や記事にもクロス集計がよく取り上げられます。この記事ではクロス集計の定義や使用するメリット、エクセルを用いてクロス集計を行う方法などを解説します。

クロス集計とは、複数の設問をかけ合わせて集計する方法です。たとえば、「利用結果に満足しているか」というアンケートをしたとします。この集計をする際「性別」「年代別」に分けて集計をするとより回答の傾向が細分化され、回答者のニーズが把握できます。

これに対し、1つの設問に対して設問を分けずに集計することを「単純集計」といいます。

単純集計の場合、1つの設問に対し、「満足」「やや満足」「不満」という内訳は分かっても、内訳の詳細は分かりません。クロス集計を行うと「満足」と答えた人のうち、性別の比率や年代の比率まで分かります。

クロス集計は、2つの設問をかけ合わせたものだけでなく、3つの設問、4つの設問を組み合わせが可能です。これを多重クロスといい、3つの設問が組み合わさっているものは3重クロス、4つの設問が組み合わさっているものを4重クロスといいます。
たとえば3重クロスの例として、「利用満足度」を「性別」と「年代」で集計する、4重クロスは、「利用満足度」を「性別」・「年代」・「使用頻度」で集計するなどが挙げられます。ただし、あまりに設問を多くしてしまうと答えが細分化しすぎてしまうので、注意しましょう。

関連記事:アンケートの作り方とは?回答率を高める方法も伝授
関連記事:アンケート結果を分析するには?集計や分析手法のいろはを解説

クロス集計を活用すると、ひとつの調査結果からさまざまな側面を分析できます。そのため、調査結果を単に「数字」として見るだけでなく、「性別」や「年代別」に見ることで新しい需要を掘り起こしたり改善点を見つけられるでしょう。たとえば、あるイベントに対して満足度の調査をした結果、「満足」と「おおむね満足」が75%となりました。しかし、クロス集計をすると、男性の満足度が45%なのに対し、女性の満足度は30%だと分かったのです。女性の満足度が男性より低いと分かったことで、イベントで改善すべき点も見えてくるでしょう。また、年代別に満足度を集計してみても別の結果が見えてくるかもしれません。このほか、分析結果が数字により可視化されることで、一目で内容が理解しやすくなります。

では、クロス集計と単純集計がどのような違いがあるのか、実際に表を作成して説明します。たとえば、以下のようなアンケートを実施したと仮定しましょう。

①あなたの性別を教えてください
・男性
・女性

②あなたは、間食をしますか。
・毎日する
・週に5〜6日する
・週に3〜4回する
・週に1〜2回する
・まったくしない

この結果を単純計算表で表すと以下の通りです。

あなたの性別を教えてください

実数 比率
男性 300人 60%
女性 200人 40%

あなたは、間食をしますか。
実数 比率
毎日する 50人 10%
週に5〜6日する 100人 20%
週に3〜4回する 150人 30%
週に1〜2回する 110人 22%
まったくしない 90人 18%


単純計算表の場合それぞれの質問にどのくらいの人が答えたか、質問の回答比率や平均値を分かりやすく表すことが可能です。なお、単純集計を英訳すると「Grand Total」であるため、単純計算表は別名「GT表」とも呼ばれます。シンプルな単純計算表は調査の全体を把握するのに適しています。たとえば、「男性の方が回答数が多い」や、「間食を週に一度もしない人も18%いる」といったことが読み取れるでしょう。調査結果の内容を大まかに把握したいときに適した方法です。

クロス集計では、どのような表にまとめられるのでしょうか。作成してみます。

「回答実数」

毎日する 週に5~6回 週に3~4回 週に1~2回 まったくしない
全体 50人 100人 150人 110人 90人
男性 20人 30人 70人 70人 60人
女性 30人 70人 80人 40人 30人

「回答比率」
毎日する 週に5~6回 週に3~4回 週に1~2回 まったくしない
全体 10% 20% 30% 22% 90人
男性 40% 30% 45% 63.3% 60%
女性 60% 70% 55% 37% 40%

このようにクロス集計であれば、単純計算表より結果を細かく分析できます。たとえば、毎日間食する人の60%は女性だが、週に3~4回間食をする人は、男女の比率がほぼ同じ、と分かるでしょう。しかし、クロス集計表だけを実施すると、ミクロな視点にしばられてしまい全体を把握できません。そのため、最初に単純集計表を作っておき、それをもとにクロス集計表を作り、分析したい内容によって使い分けたり比較したりするのがおすすめです。

クロス集計のやり方〜エクセル編〜

クロス集計は、データが多いほど行うメリットが大きくなる集計方法です。ここでは、エクセルの機能を使ってクロス集計を実施する方法を解説します。

cross-tabulation1

たとえば、上記のような店舗別のカメラ売上をまとめたエクセルのデータがあったとします。これはサンプルなので単純な集計ですが、一般的にはより複雑な集計結果を用います。

cross-tabulation1

手順①
クロス集計を行う場合はまず、クリック分析からテーブル(I)を選択しましょう。集計表を全て選択し、右下に現れたアイコンをクリックすると「テーブル(I)」を含む選択肢が現れます。

手順②
テーブル(I)からさらにテーブルを選択すると、ピボットテーブルのチェックフィールドが出ます。ここで、集計したい項目にチェックを入れましょう。

cross-tabulation1

たとえば、「支店」と「コンデジ」にチェックを入れると、集計表から支店とコンデジがピックアップされて表示されます。

今回は、設問が少ない集計表を用いましたが、「ピポットテーブル機能」を使えば、大量の設問がある集計表でも、分析したい項目をピックアップして簡単にクロス集計表を作ることが可能です。もし手順①でアイコンが出てこなければ、集計表を全て選択した後に挿入の中にある「ピボットテーブル」をクリックすることで、同様に作成できるので試してみてください。

クロス集計を作る場合、いくつか覚えておくと便利な用語があります。ここでは、クロス集計によく使われる用語の紹介と解説を行います。ぜひ、参考にしてください。

表頭(ひょうとう)とは、表の1番上の横ラインを指します。オレンジ色に塗られた部分です。表側(ひょうそく)は縦ラインです。青色に塗られた部分を指します。クロス集計表では、設問項目を表頭と表側にそれぞれ当てはめ、両者に該当する回答実数などを明記します。


毎日する 週に5~6回 週に3~4回 週に1~2回 まったくしない
全体 50人 100人 150人 110人 90人
男性 20人 30人 70人 70人 60人
女性 30人 70人 80人 40人 30人

Nは調査対象全体の総数(母集団)です。たとえば、1,000人にアンケートをとった場合、Nは1,000と表されます。一方でnは、母集団から抽出した個数体の総数であり、母集団から15の個数体を取り出した場合、nは15と表されます。ちなみにNはサンプル数、nはサンプルサイズと呼ばれることもあるので、合わせて覚えておきましょう。

クロス集計のサンプル数とは、「群数」や「標本数」を意味します。つまり、Nです。500人にアンケートを行った場合のサンプル数は500で、この数が多いほど大規模な調査といえます。一方サンプルサイズとは「各群のサイズ」であり、クロス集計ではnと同義語です。500人にアンケートを行い、それが女性350人、男性が150人だった場合、サンプルサイズはそれぞれ350と150で表されます。

クロス集計をはじめとする集計調査で、サンプルサイズを決めるとき「結果の精度」をどの程度に設定するかを基準にすることがあります。この基準のひとつとして「サンプリング誤差」を活用できます。たとえば、ある商品購入者を対象にアンケートを実施するとします。購入者全員にアンケートを実施するのが理想的ですが、時間などの制約から一部の人のみに実施できません。そのため「何人に調査したら、母集団を調査した時と同じような結果を得られるか」を判断する観点として「サンプリング誤差」を活用できます。より正確な集計を行う場合は、サンプリング誤差を小さくすることが大切です。

しかし、誤差を0にすることは難しいので集計をする前に「誤差を許す範囲」を決めます。これが最大許容範囲です。最大許容範囲がどのくらい信頼できるかを示した「信頼度」は%で表され、信頼度90%ならば「100回調査したら10回は間違った結果になる可能性がある」という意味です。なお、信頼度によって最大許容範囲は違います。なお、誤差を算出する「計算式」もありますが、統計学を学んでいないと理解するのは難しいでしょう。現在は、「誤差をできるだけ小さくするための自動計算ツール」などもネット上にアップされています。「クロス集計を行うので、できるだけ誤差の少なくなるように、サンプル数を決めたい」という場合は、自動計算ツールなどを利用してみましょう。

アンケートやクロス集計を使った市場調査は、もちろんマーケティングには欠かせませんが、よりリアルに顧客を知る方法のひとつに「レシートデータの活用」が挙げられます。レシートデータの魅力は、横断的に購買データを分析できる点です。具体的にはレシート1枚で、日付・時間・商品名及び金額(値引・単価・個数)・合計金額・電話番号、さらには購入した店舗のチェーン名・店舗名などの情報からユーザーのリアルな購買行動を把握できます。

「IDレシートBIツール」なら、消費者の購買や併買のデータを、店舗・カテゴリーを横断的に確認できます。膨大なデータを自社で集計・分析するには時間がかかるという場合に利用すると、効果測定の手間が大幅に短縮できるでしょう。また、同ツールでは、独自で構築した膨大なレシートデータから、コンビニエンスストア・スーパー・ドラッグストアなどの店舗別の売れ行きを可視化しています。POSデータでは見えづらかった自社商品の「買う人」と「買われ方」をしっかりと把握できるため、自社と競合商品の実売価格・売上が確認でき、顧客の理解だけではなく、商談時の資料としても利用可能です。

「IDレシートBIツール」の詳しい情報はこちらをご覧ください。

では、具体的に「クロス集計」を活用するのは、どのような場面なのでしょうか。
当サイトに掲載している"IDレシートデータ"活用事例から、そのポイントを紹介します。

例えば、近年コンビニが「冷凍食品」に力を入れています。そこで、どのような属性の方が、どのように購入しているかを調べることで、「コンビニ冷凍食品」の価値を分析するレポート記事を作成しました。そこで活用した「クロス集計」の例をご確認ください。

■「同時併買比率」の男女比
下記のように「コンビニ冷凍食品」をどのような商品と一緒に購入しているかの「同時併買比率」を男女で比較するのに、クロス集計を利用しています。


コンビニ冷凍食品の時間帯別同時併買商品

コンビニ冷凍食品の時間帯別同時併買商品

■購入時間帯比較
また、売れ筋の「冷凍食品」が、どの時間帯に購買されているのかを確認するためにも、「クロス集計」は役立ちます。下記は、スーパーマーケットとコンビニで、冷凍食品の購買時間にどのような差があるのかを集計しています。


購入時間帯比較

購入時間帯比較

■時間帯別のランキング比較
さらに、商品ごとに売れる時間帯の特徴があるかを調べるために、売れ筋商品の時間帯別のランキングを比較するグラフを作っています。下記のように、クロス集計で商品ごとの時間帯別ランキングを割り出し、その順位の変動をグラフで可視化すると、どの商品が、どの時間帯に伸びているのか、逆に減少しているのかが見えてきます。


「ファミリーマート」時間帯別の人気商品比較

「ファミリーマート」時間帯別の人気商品比較


▼"IDレシートデータ"では、帳票ファイルをCSVデータでダウンロードできるので、クロス集計など自由にデータの加工ができます。エクセルの「ピボットテーブル」を活用できるようになると、分析の幅が非常に増えますので、ぜひ活用してみてください。 分析レポートの詳細は、こちらをご覧ください。
購買データから考える「コンビニ冷凍食品」の価値とは?

▼また、その他のいろいろな視点での"IDレシートデータ"活用事例は、こちらをご覧ください。
“IDレシート”分析レポート

この記事では、クロス集計の定義と行うメリット、単純計算表との違い、エクセルを使ったクロス集計表の作り方などを紹介しました。ネットを使って不特定多数にアンケートをはじめとする調査を行い、顧客のニーズを掘り起こすことは多くの企業が行っています。しかし、せっかく有効なデータを集めても活用しなければ、意味がありません。クロス集計は単純集計と異なり、集計結果を多数の面から活用できる集計表です。エクセルを使えば、集計表を作ることも簡単にできます。ぜひ、データの活用法として利用してみましょう。

お問い合わせ

流通横断かつユーザ軸での貴社/競合ユーザ様の購買動向の違いが分かります。

詳細資料・サンプルレポートをご希望の方は、お気軽にお問い合わせください。