協調フィルタリングとは?
基本的な考え方や種類を解説

協調フィルタリングとは?基本的な考え方や種類を解説

「協調フィルタリングってどういうもの?」
「レコメンデーションとどういうつながりがあるの?」

といった疑問を持つ方も多いのではないでしょうか。この記事では、協調フィルタリングの基礎知識や種類を紹介します。さらに近年注目されている、協調フィルタリングとディープラーニングの活用事例も解説するので、ぜひ今後のマーケティング施策の参考にしてください。

協調フィルタリングは一体どういうものなのでしょうか?ここでは、協調フィルタリングの理解に必要な以下の2点を解説します。

  • そもそも協調フィルタリングとは何か
  • 内容ベースフィルタリングと何が違う?

ひとつずつ確認しましょう。

ECサイトや配信事業などで、ユーザーに対して商品やサービスをおすすめするサービスが「レコメンデーション」です。レコメンデーションの手法のひとつとして、協調フィルタリングは広まりました。従来のレコメンド機能は、あらかじめ設定した商品やサービスがユーザーの属性に関係なく表示される仕組みでしたが、ユーザーの需要を的確に満たせない欠点がありました。そのためパーソナライズされた情報を提示できる、協調フィルタリングに注目が集まったのです。

レコメンデーションに協調フィルタリングを用いることで、システムはあるユーザーの消費活動と、別のユーザーのデータを照会できます。そして、お互いの行動を関連づけ、個人の需要を予想して商品やサービスを薦められます。協調フィルタリングはアイテム同士を結びつけているのではなく、複数の個人データを分析するのが特徴です。つまり、ユーザーが「欲しいのに持っていないもの」や「知らなかった意外なもの」を訴求できる強みを備えています。ただし、購入履歴の少ない商品はレコメンドできないのが協調フィルタリングのデメリットです。

レコメンデーションで使われる手法として、「内容ベースフィルタリング」も挙げられます。内容ベースフィルタリングはユーザーが購入した商品のタグ情報から、レコメンドするアイテムを選定します。ユーザーの興味がある分野をしっかりと把握することを目的としているので、ユーザーの趣味・嗜好(しこう)を高確率で押さえられ、類似商品をおすすめできるのがメリットです。しかし、タグをすべての商品に設ける手間が発生してしまうデメリットがあります。

協調フィルタリングとの最大の違いは、何を基準としてレコメンド商品を選んでいるかです。協調フィルタリングがユーザー同士の購買履歴を分析するのに対し、内容ベースフィルタリングはあくまでタグを基準にしています。購入履歴の少ない商品を訴求したいなら内容ベースフィルタリング、ユーザーの消費傾向を細かく踏まえたいなら協調フィルタリングが適しています。

関連記事:レコメンデーションとは?マーケティングの常識を知ろう

協調フィルタリングには以下の3種類があります。

  • メモリーベース
  • モデルベース
  • ハイブリッド

それぞれの特徴とメリット・デメリットを押さえましょう。

顧客との取引で発生した情報を「トランザクションデータ」と呼びます。そして、トランザクションデータを基にしてレコメンデーションを行う協調フィルタリングが「メモリーベース」です。メモリーベースは「ユーザベース協調フィルタリング」と「アイテムベース協調フィルタリング」に分けられます。両者とも、商品に対する評価値を解析してレコメンド情報を処理するのは同じです。ただ、ユーザーをベクトル化するのがユーザベース協調フィルタリングで、アイテムをベクトル化するのがアイテムベース協調フィルタリングです。

メモリーベースでは未評価の商品であっても、ユーザーがどのように評価するかを予測できます。すなわち、運営側さえ内容を知らない商品であっても、トランザクションデータさえ活用できれば的確なレコメンデーションを行えるのです。そのかわり、レコメンデーションの正確性はトランザクションデータの量に左右されてしまう点は理解しておきましょう。

ユーザーによる商品の評価データを抽象化して活用するのが「モデルベース」です。モデルベースでは、評価データは圧縮された状態で保管され、システムは統計的なアルゴリズムによって、消費活動のモデルを作り上げます。このモデルに照らし合わせながら、ユーザーへのレコメンド商品を選んでいくのが特徴です。モデルベースのメリットは再利用がしやすい点でしょう。システムが変わったとしても、モデルさえ取り出して流用すれば同じレコメンデーションを続けられます。そのかわり、メモリーベースに比べると、開発の工程が多くなるのはデメリットです。

協調フィルタリングのほか、レコメンデーションにはコンテンツベースフィルタリングという手法もあります。コンテンツベースフィルタリングは、あらかじめ設定したコンテンツの属性とユーザーの購買活動を照会し、おすすめアイテムを選ぶ方式です。そして、協調フィルタリングとコンテンツベースフィルタリングの長所を組み合わせたのが「ハイブリッド」です。

たとえば、コンテンツベースフィルタリングは、レコメンデーションがパターン化されやすく、協調フィルタリングは、訪問回数の少ないユーザーに対して機能しにくい問題があります。ハイブリッドではそれぞれの欠点が補われ、幅広いユーザーに適切なレコメンデーションを実行できるのです。ハイブリッドタイプのレコメンデーションは、時代とともに主流になりつつあります。ただし、複数の手法を組み合わせなければならないので、開発に手間がかかるのは注意点です。

協調フィルタリングの基本的なポイント(ユーザベース編)

コンテンツの評価値を解析し、ユーザーをベクトル化していくのがユーザベース協調フィルタリングです。代表的な運用方法として、5段階評価システムが挙げられます。まず、ユーザーはあるサイト内で商品を購入したり、記事を読んだりしたら、評価を5段階でつけます。次に、システムは5段階評価を基にしてユーザー同士の相関関係を分析し、未評価のおすすめコンテンツをレコメンドしてくる流れです。

具体的な例として、あるサイトで、複数のユーザーが美容アイテムを5段階評価していたとします。ただ、人によっては、まだ知らない商品もあるでしょう。そのような場合、システムはレコメンデーションを行うため、そのユーザーと似た購買履歴と評価傾向を持っている人を探します。そして、お互いの評価データを照会するのです。

仮にユーザーAがリップやペディキュアを高く評価していたとします。逆に、ユーザーAはファンデーションに低評価をつけました。そうすると、システムは同じ商品に似た評価をつけているユーザーBやCを探します。そのうえで、BやCが高評価をつけているのに、Aがまだ買っていない商品としてマニキュアを導き出します。そうやってシステムがマニキュアをユーザーAにレコメンドすれば、BやCと同じように高評価をつけてくれる可能性が大きいからです。実際の協調フィルタリングでは、より膨大なデータを対象としてレコメンドアイテムの選定がなされています。

レコメンド機能の手法は協調フィルタリングだけでなく、近年ではディープラーニングにも注目が集まっています。ここでは、ディープラーニングが注目される理由と、実際に活用している「Spotify」を紹介します。

スポティファイ・ ディープラーニングは日本語で「深層学習」とも表現されています。協調フィルタリングの欠点を克服できる、レコメンデーションの手法として注目されるようになってきました。そもそも、協調フィルタリングでは、ユーザーの趣味や嗜好(しこう)を細かく反映するのは難しかったといえます。なぜなら、根拠にしているのがあくまでもユーザーの購買履歴であるため、データが少ないと的確な分析を行えないからです。しかし、ディープラーニングなら人間の行動をシステムに学ばせられます。データ収集の量に関係なく、ユーザーの好みを予想してレコメンドにつなげられるのが特徴です。

ディープラーニングの根幹は「ニューラルネットワーク」といい、人間の神経細胞を模しています。ニューラルネットワークを多層に構築し、システムはデータを掘り下げて学習します。データに含まれているわずかな特徴さえ、ディープラーニングでは段階的に分析されてシステムが起こすアクションに生かされるのです。下記では実際に協調フィルタリングとディープラーニングを掛け合わせて利用している企業を紹介します。

スポティファイ・ テクノロジーが運営している、音楽のストリーミング・サービスです。Spotifyでもユーザーに対し、自動的に楽曲のレコメンドを続けてきました。しかし、協調フィルタリングだけではユーザーの行動履歴を反映するだけで、新しい音楽と引き合わせることが難しかったのです。それに、「アイドルソングが嫌いな人がたまたま、余興用に聴いていた」といった、変則的なケースにも協調フィルタリングは対応できません。そこで、Spotifyは協調フィルタリングとディープラーニングを組み合わせたレコメンド機能を開発しました。その結果、行動履歴には表れないユーザーの好みを学習し、音楽を薦められるようになりました。

関連記事:ビッグデータ活用事例集|12業界の実例から知識を得よう

協調フィルタリングは、パーソナライズされた情報を提供するにはもってこいの手法です。一方で、パーソナライズされた情報を提供するには、今まで以上に多くの量のデータ分析が求められます。「IDレシートBIツール」なら、膨大なデータの集計や分析・効果測定の手間が大幅に短縮できるでしょう。また、同ツールでは、消費者の購買や併買のデータを、店舗・カテゴリーを横断的に可視化できます。POSデータでは見えづらかった自社商品の「買う人」と「買われた」をしっかりと把握できるため、自社と競合商品の実売価格・売上が確認でき、ユーザーの理解だけではなく、商談時の資料としても利用可能です。

「IDレシートBIツール」の詳しい情報はこちらをご覧ください。

従来のレコメンデーション機能は、協調フィルタリングによっておすすめアイテムを選定していました。しかし、それだけでは多様化するユーザーの好みを満足させられません。また、新規ユーザーには適切なレコメンドができなくなってしまいます。ディープラーニングをはじめとする、新しい技術との組み合わせが大切になってくるでしょう。

お問い合わせ

流通横断かつユーザ軸での貴社/競合ユーザ様の購買動向の違いが分かります。

詳細資料・サンプルレポートをご希望の方は、お気軽にお問い合わせください。