本レポートは、4年間(2018年から2021年まで)の様々な商品の販売データを含むスーパーストアの販売データセットの探索的データ分析(EDA)を提供します。この執筆の目的は、HEARTCOUNTの主な機能を使用し、学んだことを実際のデータセットで応用できるようにすることです。HEARTCOUNTによって行われる分析は、間違いなくあなたがデータをより深く理解し、ビジネス上の意思決定に役立つ可能性のある興味深いパターンや関係を特定するのに役立ちます。
- HEARTCOUNTにログインし、"キャンペーン生成 "メニューからサンプルの "Superstore Sales Dataset "を使用します。
データセットは、9,994個のオブザベーションと、注文日、出荷日、出荷モード、商品カテゴリ、売上、利益を含む21個の変数を含む。データセットには欠損値はなく,データ型は整数,浮動小数点数,オブジェクトを含みます。
スマートプロット
- 注文日別売上高
- 2018-2021年売上平均の可視化
- 平均売上高が最も高い月は2018年3月(354.72)、次いで2020年3月(317.28)。
最も売上高が低い月は2018年2月(98.26)。
2. 2021年下期売上予想
2つの方法で売上高(平均)を予測: 最小二乗法と最大エントロピー法
- 2021年7月
- 186.85K (最大エントロピー法)
- 185.81K (最小二乗法) - 2021年8月
- 185.4K(最大エントロピー法)
- 187.7K(最小二乗法) - 2021年9月
- 200.17万ドル(最大エントロピー法)
- 195.79万ドル(最小二乗法) - 2021年10月
- 188.49K (最大エントロピー法)
- 187.15K (最小二乗法) - 2021年11月
- 185.2K(最大エントロピー法)
- 184.17K(最小二乗法) - 2021年12月
- 191.97K (最大エントロピー法)
- 187.08K (最小二乗法)
3. 曜日別売上高
- 曜日別の平均売上は、日曜日が最も高く(259.68)、次いで月曜日、水曜日、土曜日となっている。
- 木曜日が最も売上が低い(216.3)ことがすぐにわかるだろう。
4. 出荷形態別売上高
- 配送方法別の売上高は、「当日」が236.4ドルで最も高く、「通常」が227.58ドルで最も低い。
5. 地域別売上高
- 地域別売上平均は南部が24.1万ドルで最も高く、東部、西部と続く。
- 一方、中央部は平均215.77万ドルで最も低い。
6. サブカテゴリー別数量(合計)
- 製品サブカテゴリー別の数量(合計)は、「ファスナー」が4.21万個で最も多く、「消耗品」が3.41万個で最も少ない。
- 数量上位3つは、ファスナー、バインダー、テーブルである。
分析
- 二変量解析
- 売上高と利益には正の相関があり、相関係数は0.48である。以下の散布図は、売上高と利益の関係を示している:
- スモール・マルチプルは、利益と最も高い相関を持つ変数を見つけるのに役立つ。
- カテゴリー別に分類すると、売上高と利益の相関関係はそれぞれ異なる。
2. 多変量解析
- 次の並行座標プロットは、売上高、利益、製品カテゴリーの関係を示している。売上高と利益が最も高いのは、テクノロジーとオフィス用品のカテゴリーであることがわかる。
3. 時系列分析
- 以下の折れ線グラフは、4年間の売上高の推移を示している。売上高には季節的なパターンがあり、毎年下半期に売上高が増加することがわかる。
結論として、このEDAレポートはスーパーストアの売上データセットに関する洞察を提供しました。このデータセットには、4年間にわたる様々な商品の売上と利益のデータが含まれています。分析の結果、売上高と利益には正の相関関係があり、テクノロジー・カテゴリーの売上高と利益が最も高いことが明らかになりました。また、売上には季節的なパターンがあり、毎年下半期に売上が高くなっています。これらの調査結果は、売上と利益を増加させるために、テクノロジーとオフィス用品のカテゴリーに焦点を当てるなど、ビジネス上の意思決定を行う際に役立つ可能性があります。