#2 スーパーストアの売上データセットを用いた時系列EDA

#2 スーパーストアの売上データセットを用いた時系列EDA

さまざまなデータから洞察を獲得するEDA(探索的データ分析)について、スーパーの購買履歴データを使って、ビジュアル分析、時系列予測などを組み合わせた分析に関するブラグです。

このページでは、
🙌
HEARTCOUNTのオンボーディング・シリーズ2へようこそ。

本レポートは、4年間(2018年から2021年まで)の様々な商品の販売データを含むスーパーストアの販売データセットの探索的データ分析(EDA)を提供します。この執筆の目的は、HEARTCOUNTの主な機能を使用し、学んだことを実際のデータセットで応用できるようにすることです。HEARTCOUNTによって行われる分析は、間違いなくあなたがデータをより深く理解し、ビジネス上の意思決定に役立つ可能性のある興味深いパターンや関係を特定するのに役立ちます。

  • HEARTCOUNTにログインし、"キャンペーン生成 "メニューからサンプルの "Superstore Sales Dataset "を使用します。

データセットは、9,994個のオブザベーションと、注文日、出荷日、出荷モード、商品カテゴリ、売上、利益を含む21個の変数を含む。データセットには欠損値はなく,データ型は整数,浮動小数点数,オブジェクトを含みます。

スマートプロット

  1. 注文日別売上高
  • 2018-2021年売上平均の可視化
  • 平均売上高が最も高い月は2018年3月(354.72)、次いで2020年3月(317.28)。
    最も売上高が低い月は2018年2月(98.26)。

2. 2021年下期売上予想

2つの方法で売上高(平均)を予測: 最小二乗法と最大エントロピー法
  • 2021年7月
    - 186.85K (最大エントロピー法)
    - 185.81K (最小二乗法)
  • 2021年8月
    - 185.4K(最大エントロピー法)
    - 187.7K(最小二乗法)
  • 2021年9月
    - 200.17万ドル(最大エントロピー法)
    - 195.79万ドル(最小二乗法)
  • 2021年10月
    - 188.49K (最大エントロピー法)
    - 187.15K (最小二乗法)
  • 2021年11月
    - 185.2K(最大エントロピー法)
    - 184.17K(最小二乗法)
  • 2021年12月
    - 191.97K (最大エントロピー法)
    - 187.08K (最小二乗法)

3. 曜日別売上高

  • 曜日別の平均売上は、日曜日が最も高く(259.68)、次いで月曜日、水曜日、土曜日となっている。
  • 木曜日が最も売上が低い(216.3)ことがすぐにわかるだろう。

4. 出荷形態別売上高

  • 配送方法別の売上高は、「当日」が236.4ドルで最も高く、「通常」が227.58ドルで最も低い。

5. 地域別売上高

  • 地域別売上平均は南部が24.1万ドルで最も高く、東部、西部と続く。
  • 一方、中央部は平均215.77万ドルで最も低い。

6. サブカテゴリー別数量(合計)

  • 製品サブカテゴリー別の数量(合計)は、「ファスナー」が4.21万個で最も多く、「消耗品」が3.41万個で最も少ない。
  • 数量上位3つは、ファスナー、バインダー、テーブルである。

分析

  1. 二変量解析
  • 売上高と利益には正の相関があり、相関係数は0.48である。以下の散布図は、売上高と利益の関係を示している:
  • スモール・マルチプルは、利益と最も高い相関を持つ変数を見つけるのに役立つ。
  • カテゴリー別に分類すると、売上高と利益の相関関係はそれぞれ異なる。

2. 多変量解析

  • 次の並行座標プロットは、売上高、利益、製品カテゴリーの関係を示している。売上高と利益が最も高いのは、テクノロジーとオフィス用品のカテゴリーであることがわかる。

3. 時系列分析

  • 以下の折れ線グラフは、4年間の売上高の推移を示している。売上高には季節的なパターンがあり、毎年下半期に売上高が増加することがわかる。

結論として、このEDAレポートはスーパーストアの売上データセットに関する洞察を提供しました。このデータセットには、4年間にわたる様々な商品の売上と利益のデータが含まれています。分析の結果、売上高と利益には正の相関関係があり、テクノロジー・カテゴリーの売上高と利益が最も高いことが明らかになりました。また、売上には季節的なパターンがあり、毎年下半期に売上が高くなっています。これらの調査結果は、売上と利益を増加させるために、テクノロジーとオフィス用品のカテゴリーに焦点を当てるなど、ビジネス上の意思決定を行う際に役立つ可能性があります。

🙌
ぜひ、ご自分のデータでEDAを続けてみてください。次回のシリーズは、HEARTCOUNT premiumを使ったタイタニック・サバイバー・サンプルデータセットの高度な分析です。いかがでしょうか?いつでもご意見をお寄せください!
無料のデータ分析ツール、誰でも簡単に! | HEARTCOUNT
Googleで検索するように、データを探索しましょう。データアナリストがいなくても、簡単にインサイトを見つけることができます。今すぐ無料で始めましょう!