サロン経営ラボRefine
  • ホーム
  • 当サイトについて
    • 当サイトの説明
    • 管理人自己紹介
    • 経営とコンサルティングについて
  • 経営ブログ
    • データ分析実装
    • 経営戦略
    • 人事・労務
  • 学習ブログ
    • 経営戦略(学習)
    • データ分析(学習)
    • マーケティング(学習)
    • 財務・会計(学習)
  • 書籍レビュー
    • 経営戦略(書籍)
    • データ分析(書籍)
    • マーケティング(書籍)
    • 財務・会計(書籍)
  • お問い合わせ
    • お問い合わせ
    • プライバシーポリシー
サロン経営ラボRefine
より良い経営を探求する
データ分析実装経営ブログ

美容室の新メニューに対する顧客反応分析

【ロジスティック回帰、ランダムフォレスト】

by Yoshinori Inoue 2023年11月18日
written by Yoshinori Inoue 2023年11月18日
7.3K

目次

  • データの読み込みと説明
    • 読み込み
      • 仮説を立ててみる
    • EDA(Explanatory Data Analysis)
      • 相関行列
      • 要約統計量
      • 新メニュー比率
  • モデリング
    • モデル1(Logistic Regression)
    • モデル2(Random Forest)
    • モデル選択
  • モデルを活用する
  • 参考書籍
    • 多変量解析入門――線形から非線形へ
    • scikit-learn、Keras、TensorFlowによる実践機械学習 第2版
    • データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

こんにちは、美容室経営研究所Refineの井上です。

今回は美容室を営む企業で新メニューを導入したときの顧客反応分析を行っていこうと思います。

もちろんデータは私の自作データですのでご注意ください。

データの読み込みと説明

読み込み


import pandas as pd
import numpy as np

data = pd.read_excel("new_menu.xlsx")
data

今回のデータセットを読み込みました。

以下で、各変数について説明します。

  • 「性別」は、各顧客の性別です。ここでは男性0、女性1と設定します。
  • 「年代」は、各顧客の年代データです。
  • 「平均来店周期」は、各顧客の平均の来店周期データです。
  • 「来店回数」は、これまでの来店回数を表しています。
  • 「新メニュー」は、顧客が新メニューをやってくれたかどうかです。やってくれたら1、やってくれていないなら0です。

300rowsなので、上記の顧客データが300人分集まっているクロスセクションデータであることがわかります。

仮説を立ててみる


ここで各変数から仮説を立ててみましょう。

目的変数である新メニューがどのようなメニューなのかわかりませんので、性別や年代など、説明変数からどのような顧客に好まれているのか見当もつかないですね...

通常のビジネスシーンであれば、あらかじめ狙ったターゲットに対して新メニューを打ち出すことになると思いますので、各変数の傾向も想像つくかと思います。

今回の分析では、とりあえずこのまま仮説を立てずに実行していきます。

お許しください(^▽^;)

EDA(Explanatory Data Analysis)


得られたデータに対してEDAを行っていこうと思います。

まずは、「顧客ID」は変数ではありませんのでインデックスに設定します。

data = data.set_index('顧客ID')

次に、全体で新メニューをやった人とまだやっていない人で分けたときに、各変数の平均がどのくらいの割合になっているのか見てみましょう。

# 新メニューの利用状況(0か1)によるグループ化
grouped_data = data.groupby('新メニュー').mean()
grouped_data

これを見ると、来店周期が短めの人が多く新メニューをやってくれているのではないかな?と想像できます。

おそらく金額的に軽量なメニューなのだろうと思います。

相関行列

次は、各変数間の相関係数を見てみます。

# 全変数間の相関係数を計算
correlation_matrix = data.corr()
correlation_matrix

相関係数を見ると、女性の方が来店周期が長い、という直観に反さない傾向がありそうです。

要約統計量

次に要約統計量を見ておきましょう。

# 基本的な記述統計
data.describe()

平均を見ると、男性の方が多めで、新メニューはやってくれていない人が多い、というのがわかります。

男性の方が多いというのは、美容室においては直観に反する内容ですが、自作データなのでそこは見逃してください。

新メニュー比率

では、どのくらいの割合の人が新メニューをやってくれているのでしょう?

# 新メニューの利用者と非利用者の割合
# Normalizeで割合を集計
new_menu_counts = data['新メニュー'].value_counts(normalize=True)
new_menu_counts

18%の人が新メニューを実施したと出ました。

先ほどの新メニューの平均の値と同じですね。0と1のダミー変数なのでそうなります。

ページ: 1 2

分析経営美容室
previous post
美容室の売上高を重回帰分析でモデリング
next post
売上高の時系列分析(1)

You may also like

サロン経営ノート...

2024年8月29日

サロン経営ノート...

2024年8月11日

サロン経営ノート...

2024年7月27日

顧客特性をグルー...

2024年4月12日

顧客の来店頻度を...

2024年4月11日

売上高の時系列分...

2023年11月28日

売上高の時系列分...

2023年11月22日

美容室の売上高を...

2023年11月14日

美容室の顧客離反...

2023年11月10日

Category search

【Author】

井上 慶典

Yoshinori Inoue


株式会社Nfractal(美容室)代表取締役

経営コンサルタント

専門分野


経営戦略

マーケティング分析

論理思考

興味関心


機械学習

ベイズ統計学

経営全般

保有資格


美容師

管理美容師

統計検定準1級

ビジネス統計スペシャリスト

最近の投稿

  • 「現代数理統計学の基礎」(久保川著) 2章の演習問題を解いてみる
  • サロン経営ノート(ロジカルシンキング編)―論理的思考を深める―
  • サロン経営ノート(経営戦略編)―中小企業の負けないための戦い方―
  • 確率分布(probability distribution)曼荼羅
  • サロン経営ノート(分析編)―データ分析をどう活用できるか―
  • Facebook
  • Linkedin
  • ホーム
  • 当サイトについて
    • 当サイトの説明
    • 管理人自己紹介
    • 経営とコンサルティングについて
  • 経営ブログ
    • データ分析実装
    • 経営戦略
    • 人事・労務
  • 学習ブログ
    • 経営戦略(学習)
    • データ分析(学習)
    • マーケティング(学習)
    • 財務・会計(学習)
  • 書籍レビュー
    • 経営戦略(書籍)
    • データ分析(書籍)
    • マーケティング(書籍)
    • 財務・会計(書籍)
  • お問い合わせ
    • お問い合わせ
    • プライバシーポリシー

@2019 - All Right Reserved. Designed and Developed by PenciDesign

サロン経営ラボRefine
  • ホーム
  • 当サイトについて
    • 当サイトの説明
    • 管理人自己紹介
    • 経営とコンサルティングについて
  • 経営ブログ
    • データ分析実装
    • 経営戦略
    • 人事・労務
  • 学習ブログ
    • 経営戦略(学習)
    • データ分析(学習)
    • マーケティング(学習)
    • 財務・会計(学習)
  • 書籍レビュー
    • 経営戦略(書籍)
    • データ分析(書籍)
    • マーケティング(書籍)
    • 財務・会計(書籍)
  • お問い合わせ
    • お問い合わせ
    • プライバシーポリシー