こんにちは。NRI CXコンサルティング部の平原一輝/松井拓郎です。
本記事ではNRI独自の調査アンケートである「生活者1万人アンケート」を活用した価値観クラスタリングの事例についてご紹介します。特にお金持ちの価値観の違いに基づいて、どのような行動特性があるかを分析する手法とその結果を説明していきます。ぜひ最後までご一読ください!
「NRI生活者1万人アンケート」の概要
単純な消費実態などの行動に関するアンケート項目だけではなく、回答者の価値観に関する設問も多く含まれているため、時代とともにどのように国民の価値観が遷移しているのかなどをマクロ的に把握し、NRIとして対外に発信しています。
https://www.nri.com/jp/news/newsrelease/lst/2021/cc/1119_1
今回はこの1万人アンケート結果を活用し、よりミクロ的な視点で、お金持ちはどういった行動をする傾向があるのかデータから分析していきます。
お金持ちの価値観別の行動把握
いきなりですが、お金持ちの生活を想像するとどういった行動が思い浮かぶでしょうか?
単純な仮説としてお金持ちはブランド品を好んで高級車に乗りながら、年に数回は海外旅行!みたいなイメージは持ちやすいのではないでしょうか?
一方でもしかすると、派手な消費はせず慎ましく生活を送っているが、実はものすごい資産を持っている方もいるかも知れません。
このように単純にお金持ちといっても価値観の違いにより行動に違いが出てくるものと想定できます。
そこで今回は以下の手順にて生活価値観別に人物像のクラスターを作成し、それぞれのクラスターに所属するお金持ちの行動の違いを分析することとしました。
検討の手順
それでは具体的な分析手順です。今回は以下の手順で分析から結果の把握を行いました。
分析-1 : クラスタリング入力情報の整理
- お金持ち*1の1万人アンケート回答項目の中から価値観に関する回答項目を整理する
分析-2 : 価値観別クラスターの作成
- 1万人アンケートにおける生活価値観に関する回答項目を活用して価値観クラスターを作成する
結果 : 各クラスターの行動特性把握
- 1万人アンケートにおける生活価値観に関する消費・サービス利用実態に関する回答項目を活用して それぞれのクラスターに所属するお金持ちの行動特性を把握する
以降、手順ごとの詳細を順番に説明していきます。
分析-1 : クラスタリング入力情報の整理
まずは価値観クラスターを作成するための入力情報を作成します。
1万人アンケートには価値観に関する調査項目として大きく分けて以下があります。
-
日常生活に関する価値観
-
人間関係に関する価値観
-
消費活動に関する価値観
-
情報利用に関する価値観
-
環境意識に関する価値観
例えば日常生活に関する調査項目としては4段階尺度法にて以下のような設問が複数項目あるような形になります。
複数の設問項目をそのままクラスターの入力として利用することも可能ですが、今回は作成したクラスター内のお金持ちがどのような価値観を持つのかを把握したいため、入力値が複数あると結果の解釈が困難になります。
したがって今回はそれぞれの価値観に関する複数のアンケート項目を因子分析により要約し、設問の背後にある回答者のグループをクラスタリングの入力値として利用することにしました。
因子分析とはマーケティングリサーチにて広く利用される手法であり、今回のように複数の項目を少ない変数で要約して解釈を容易にする手法です。
例えば今回の場合「生活価値観」に関する複数の調査項目を因子分析により類似した項目に集約し、最終的に
- ダイバーシティ評価因子
- 社会貢献評価因子
- 個人能力評価因子
- 同調性評価因子
の4項目に絞り込みました。それぞれの因子の中で高い因子負荷量*2を持つ調査項目を確認すると、その回答者のグループの特徴が見えてくるのでその内容をもとに上記因子の名前をつけています。
ダイバーシティ評価因子を見てみると「男性同士、女性同士でカップルとなっても構わない」に関して「そう思う」と回答した人は「同棲・事実婚のカップルも、入籍したカップルと同等に扱われるべきである」や「結婚をしないで子どもを産んでもかまわない」に関しても「そう思う」と回答する傾向がありそうなのでうまく分類できていそうです。
因子分析を行うに当たってはPythonのパッケージを利用しました。簡単に因子分析の実行が可能なのでぜひ試してみてください。
from factor_analyzer import FactorAnalyzer
#入力 df: ユーザーごとのアンケート回答結果(index: UserID / columns: 調査項目)
#因子数
n=4
#因子分析の実行
fa = FactorAnalyzer(n_factors=n, rotation='promax', impute='drop')
fa.fit(df_consumer)
df_result=pd.DataFrame(fa.loadings_, index=df_consumer.columns)
#各因子の調査項目ごとの因子負荷量の可視化
cm=sns.light_palette("red", as_cmap=True)
df_result.style.background_gradient(cmap=cm)
#共通因子の取得
co_var =fa.get_communalities()
# 因子負荷量の二乗和,寄与率,累積寄与率の取得
var = fa.get_factor_variance()
今回の分析においては因子分析を適用した価値観項目に関してはそれぞれの主要因子に対する因子得点*3をユーザーごとに算出し、最終的にクラスターの入力値としています。最終的に価値観の項目として利用した指標は以下の内容になります。
分析-2 : 価値観別クラスターの作成
ここまでの段階で入力情報の準備ができたので、実際にクラスタリングを実行していきましょう!
今回はクラスタリングの手法として「潜在クラス分析」を利用しました。
潜在クラス分析とは社会調査データの分析を目的として研究されてきた手法で、純粋な統計学から生まれたクラスタリング手法になります。連続変数だけではなく、カテゴリカル変数も含めて解析することができるため、今回のようなアンケートデータの解析においては最適な手法と考えました。また、最尤推定法などを用いて入力データの背景にある隠れたセグメント情報を抽出することができるため、アンケートの回答結果からその背後にあるお金持ちの価値観セグメント理解したい目的にも沿っています。
今回は、潜在クラス分析が簡単に実装可能なRのパッケージを利用しました。
まずpoLCAのパッケージと上記手順で作成したクラスタリングの入力データを読み込みます。
library("poLCA")
#クラスタリング入力データの読み込み
raw_df <- read.csv(file="データのPATH", header = TRUE, sep=",")
#factor型変換
filtered_df <- data.frame(lapply(raw_df, function(x){as.factor(x)}))
次にクラスタリングを実装するに当たり利用する変数を指定したうえで、クラスターの数を決定します。
今回はクラスターの数を決めるに当たってクラスター数をn=1~6まで変数としてクラスタリングを実行したのちにAIC/BIC*4情報量が最小となるクラスター数を選定することとしました。
#入力価値観因子の選択
f <- cbind(D1,#ダイバーシティ重視
D2,#社会貢献重視
D3,#個人能力重視
D4,#同調性重視
R1,#キャリア重視
R2,#親子関係重視
R3,#協力関係重視
R4,#自由度重視
C1,#環境配慮重視
C2,#個性派重視
C3,#ブランド重視
C4,#周囲評判重視
I,#インターネット利用傾向
E,#環境意識傾向
)~1
#AIC/BICを指標に最適な分類クラス数を推定
pol.aic <- numeric()
pol.bic <- numeric()
for (i in 1:6){
lca.model.tmp <- poLCA(f, filtered_df, nclass=i+1, maxiter=6000)
pol.aic[i] <- lca.model.tmp$aic
pol.bic[i] <- lca.model.tmp$bic
}
# 結果のプロット
plot(pol.aic, type="b", pch = 1, col = 2, xlab="", ylab="")
par(new=T)#上書き
plot(pol.bic, type="b", pch = 5, col = 4, xlab="class num", ylab="AIC&BIC")
legend("topleft", legend = c("AIC","BIC"),col = c(2,4), pch = c(1,5))
出力を見るとBIC基準ではクラスター数2、AICはクラスター数5あたりがよさそうです。今回は解釈を容易にするために両情報量基準の中間あたりとしてクラスター数を3を選択することにしました。
結果 : 各クラスターの行動特性把握
以上の段階でクラスタリングが完了したので、まずは結果の把握をしていきます。
潜在クラス分析のクラスタリング結果からお金持ちは以下の表の3つのクラスに分かれることがわかりました。
デモグラフィック情報・価値観・消費行動特性の観点でそれぞれのクラスの詳細に関して説明していきます。
デモグラフィック属性
各クラスのお金持ちのデモグラフィック情報にはどのような傾向があるかをまずは見ていきましょう。
子供の数の分布をみると、クラス2は子供が2人と平均的な家庭であることがわかります。
次に、回答者の年齢を見ていくとクラス2は60~80代が多く高齢者世帯であることがわかります。一方、クラス3は20~40代の現役世代が比較的多く、また世帯主の年齢が若いことから、経営者や高年収サラリーマンまたは親の代からのお金持ちであると考えられます。同居者の年齢を見ても、クラス1とクラス3は中高年夫婦とその子供であるのに対し、クラス2は高齢夫婦暮らしである可能性が高いと思われます。
さらに、回答者と配偶者の年収の傾向から、クラス1は共働きと一人働きが混在、クラス3は一人働きで高年収という違いが見られます。世帯年収ではクラス1とクラス2の分布に大きな違いは見られません。貯蓄額はクラス1が3,000~5,000万円の層の割合が多いことがわかります。また、クラス2の年収が少ない(100~200万円)ことから、既に引退し年金や資産所得で生活しているのではないかと考えられます。
価値観
次に価値観の違いにはどのような傾向があるかをみていきましょう。
各指標の見方としては項目に対して強く共感するほど5に近く、共感しないほど1に近くなります。
クラス1は生活価値観および家族・コミュニティ価値観では3から4の間、消費価値観はどの項目も3弱であり、平均値に近い中庸的な価値観の集団ではないかと考えられます。
クラス2は社会的貢献や環境配慮、ブランド評価傾向が強いため、昔ながらの日本人らしい性格を表しています。また、キャリア評価因子が弱いことから、仕事を引退したシニア層が多いというデモグラ情報とも一致します。
クラス3は個を求める傾向が強く、ダイバーシティ、個人能力、自由度、個性派探求傾向などが強いことがわかります。多様性は尊重しつつも個の力でキャリアを形成していくというような昨今の働き方や考え方が表れています。
以上の傾向を踏まえ、クラスタリング結果における各クラス名称を以下と呼称することとしました。
- クラス 1: 堅実に暮らすコツコツお金持ち
- クラス 2: 余生を楽しむシニアお金持ち
- クラス 3: 今どきのハイエンドお金持ち
行動特性
以上、デモグラフィック属性と価値観を見ることで、各クラスのお金持ちがどういう人物像がある程度イメージついたのではないでしょうか?
最後に、今回の価値観クラスタリングの目的である消費行動の特徴についてクラスごとの特徴を見ていきます!
まずは休日などによくする趣味・活動を見てみましょう。
クラス1「堅実に暮らすコツコツお金持ち」は全般的に目立つ趣味・活動がない様です。
クラス2「余生を楽しむシニアお金持ち」は散歩などの軽い運動や園芸、庭いじり、日用大工など近所でできる趣味や国内旅行・ドライブなどを見つけて日常を楽しんでいるようです。
クラス3「今どきのハイエンドお金持ち」はインドア系が多く、音楽・ビデオ鑑賞、パソコン・ゲームなど一人でもできる趣味が多い傾向にあるようです。
※ここで、当アンケートは2021年に実施したため、全クラスを通して新型コロナウイルス感染対策の観点から海外旅行などの趣味が少ないことには留意ください。
一方で、利用したことのあるサービスで見ると、クラス3「今どきのハイエンドお金持ち」は美容系の割合が多いため美意識の高さや、カラオケ・コンサート・ディズニーリゾートが多いことから家族でも出かける様子が目に浮かびます。お金持ちと聞くと派手な暮らしをしているかと思いきや、一般的な趣味や休日の過ごし方も多いようです。
最後に、インターネットの利用サービスについて見てみましょう。
インターネットサービス利用は、全般敵に現役世代の多いクラス3「今どきのハイエンドお金持ち」の利用頻度が高い傾向にあります。
特に食べログを見ると、クラス1「堅実に暮らすコツコツお金持ち」とクラス2「余生を楽しむシニアお金持ち」に対して、クラス3「今どきのハイエンドお金持ち」の利用頻度に差が大きいことがわかります。食べログに限った話ではありますが、クラス3「今どきのハイエンドお金持ち」は知人や家族等の紹介よりも食べログのような一見客観的に見える指標でお店を選ぶ傾向にあるのかもしれません。
Youtubeはクラスによらず半分以上が月に2回以上利用しているため、どのお金持ち層にもリーチしやすい媒体であると言えます。
クラス2「余生を楽しむシニアお金持ち」の利用頻度が最も高かったのはSmartNewsです。月2回以上利用する層が3割程度いるようです。
SNSの利用傾向を確認すると月2回以上利用は多い順にクラス3「今どきのハイエンドお金持ち」、クラス1「堅実に暮らすコツコツお金持ち」、クラス2「余生を楽しむシニアお金持ち」ですが、Facebookだけクラス2「余生を楽しむシニアお金持ち」とクラス1「堅実に暮らすコツコツお金持ち」がわずかに逆転しています。昔ながらの価値観を持つクラス2「余生を楽しむシニアお金持ち」は、匿名性が低く実名でつながりあえるFacebookであれば好む人が多いことを表していると言えます。
ネットショッピングの利用頻度を見ると、クラス3「今どきのハイエンドお金持ち」のAmazon、楽天利用頻度は高い一方で、Yahoo!ショッピングはクラスごとに差が小さいようです。クラス1「堅実に暮らすコツコツお金持ち」とクラス2「余生を楽しむシニアお金持ち」において月2回以上のヘビーユーザ層に大きな差はないようですが、月に1回以下の利用層を見るとクラス1ほど多いことがわかります。つまり、クラス2「余生を楽しむシニアお金持ち」はネットショッピングを頻繁に使いこなす層と全く利用しない層に分かれていると解釈できます。
まとめ
以上、1万人アンケート結果を踏まえた価値観クラスタリングの一例としてお金持ちの行動特性を確認しました。
いかがだったでしょうか?価値観の違いにより行動特性を把握することで単純に「お金持ち」という一括りで見るよりも詳細な人物像のイメージを持って行動を把握することができました。
この様に価値観クラスタリングは顧客対象のセグメントを潜在的な意識や価値観で具体的に把握することができる強力なマーケティングリサーチの手法です。ぜひ本記事を参考に取り組んでみてください。
*1:今回お金持ちの条件としては預貯金、株式、債券、投資信託、一時払い生命保険や年金保険など、世帯として保有する金融資産の合計額から負債を差し引いた「純金融資産額」が3,000万円以上のアッパーマス層以上としています。
参考リンク : https://www.nri.com/jp/news/newsrelease/lst/2020/cc/1221_1
*2:因子負荷量とは因子が測定変数に影響を与えている程度を表す値のことであり、-1 ~ 1の値の範囲をとります。値が-1に近いほど測定変数に影響していない因子、1に近いほど測定変数に影響している因子となります。
*3:因子得点とはそれぞれのユーザーが各因子に対してどの程度重みを持っているのかを算出した値になります。値が大きいほど特定のユーザーはその因子との関係が強い傾向にあると理解できます。
*4:AIC: 赤池情報量基準 BIC: ベイズ情報量基準