みなさん、おはようございます。
本日は「クラスター分析」について解説いたします。
クラスター分析とは
大きな集団の中から、似たもの同士を集めてグループ分けをする分析方法を指します。
しかし、最初からわかっている、性別情報、年齢層などの情報をもとにグループ分けすることに対してはクラスター分析とは呼びません。
クラスター分析は、消費者の購入情報やアンケート情報などから消費者や商品をクラスター分けします。そのため、最初からわかっている情報(性別、年齢層など)から取得できる情報とは全く別の分析結果を取得することが可能です。
収集する方法としては、「似ているもの」もしくは「似ていないもの」を軸として収集します。感覚的なものによって分類されることになるため、分析方法としては多くのバリエーションが存在します。
クラスター分析は「階層的手法」と「非階層的手法」の2つに分類する事ができます。
階層的手法
全てのデータ間相互の類似度または非類似度を計算し、「距離測定方法」を使って似たもの同士を同じクラスターに併合していく方法です。
最も利用される方法は「ウォード法」です。(全体的にデータがバランスよく分類されやすいためです)
非階層的手法
樹形図などの階層的な構造は持たず、事前に分けるクラスター数を決め、サンプルを指定の数の集合に分割していく方法です。似たサンプルを統計的に集め、似ていないサンプルを遠ざけていくことを繰り返していきます。
このように似たものの情報を分析することにより、通常では見えないものが見えてくる様になります。
よく購入される商品にはどの様な特徴があるのか?など、似たものを分析することで違った売り方などを見出す事ができるため、一つの分析方法として視野に入れることは大きな意味があります。