時系列分析: 時間の経過に伴う指標の変化を理解したい場合

時系列分析: 時間の経過に伴う指標の変化を理解したい場合

時系列分析の概念について学び、売上データセットを活用した実習を通じて、時系列分析について理解しましょう。

このページでは、

時系列分析とは?

時系列分析(time-series analysis)は、一定間隔の時間順に保存されたデータから有意義な情報を引き出す作業で、過去の行動を理解し、将来の行動を予測するために使用されます。

時系列はデータ分析の重要な分岐点であるにもかかわらず、その分析方法の理論と応用に対する技術的な障壁と、将来を予測することに伴う様々な限界のため、実務の観点からのデータ活用においてその使用が非常に制限されてきました。

しかしながら、現業で意思決定に活用できる時系列データが増加しており、時系列分析だけが提供できるインサイトが存在することを考えると、より多くのビジネスでより頻繁に時系列データを活用すべきだと思います。

時系列データとは?

時系列(time-series)データとは、一定の時間間隔で観測・収集されたデータを指します。そのため、時系列データには、そのレコードが収集・観測された日時を示す「時間変数」が存在します。「2022-10-01」「2019-02-07 08:55:16」のような時間変数は、特定の構造(例: 年-月-日)と順序(Order)を持つ数値型変数と考えることができます。

しかし、曜日や平日/週末、または時間帯に存在する周期的パターンを見つけるために、時間変数から月、曜日などの派生変数を加工、抽出して使用することができ、このとき、時間変数はカテゴリー型変数の特性を持つことになります。

時系列分析の目的

探索的分析(EDA)の観点から時系列データを分析する主な目標は以下の2つです。

  • トレンド(Trend): 時間の経過に伴って主要な指標が上昇、下降する傾向性。
  • 周期的/循環的特性(Cyclic Pattern): 時間帯、曜日、月、四半期/季節などによる周期的なパターン。

HEARTCOUNT実習 - 時系列データ

以下では、店舗の売上データを使って、時間の経過に伴う売上高の傾向と売上高に影響を与える周期的パターンが存在するかどうかを一緒に見てみましょう。

📍
下記の内容を自分で実施するには、HEARTCOUNTログイン → キャンペーン生成 → サンプルデータセット → Superstore Sales Dataset を選択してください。

まず、データセットのレビュープロセスで「Order Date (注文日)」という時間変数(「2014年11月8日」などの日付を値にもつ)が存在することが確認できます。

時間の経過に伴う売上の推移を見る

それでは、スマートプロットメニューから、時間の経過に伴う売上高の推移を見てみましょう。

  • X軸に時間変数である「Order Date (注文日)」を選択し、売上の集計方法を平均から(総)合計に変更します。
  • 「Order Date (注文日)」の横の時計アイコンをクリックして「Sales (売上)」を集計する時間間隔(time grain)を年、四半期、月、週などに変更してみましょう。時間間隔を月に選択すると、私たちが視覚的に認識できる適度なレベルの情報が表現されるようです。
  • サブグループに「Category (製品カテゴリー)」を選択した後、グラフタイプを「積み上げ面グラフ」に変更します。

月別に製品カテゴリー別の売上合計(総額)が計算され、積み重ねられた視覚化が完成しました。

0:00
/0:52

しかし、上のグラフを見て、いったいどのようなメッセージを伝えることができるでしょうか?

月別、製品別に売上合計にバラツキがあったという話は正しいですが、当たり前の話で情報量のないメッセージです。

売上の季節的、周期的な特性を探る

  • X軸に表現する変数を「Order Date (注文日)」の下にある派生時間変数の1つである「Order Date - 月毎」を選択してみましょう。(派生時間変数は、周期的なパターンを簡単に見つけることができるように HEARTCOUNTで時間変数を自動的に加工・作成された追加変数です)。
  • そして、年ごとに比較できるようにファセット(画面分割)の条件として「Order Date - 年」を選択します。
  • グラフタイプも「積み上げ面グラフ」から「積み上げ棒グラフ」に変更してみましょう。連続した流れではなく、個々の月に発生した具体的な売上総額(合計)を比較するには、棒グラフがより適切だと思います。
  • そして、右側のウィンドウのサブグループの凡例から「Furniture (家具)」「Office Supplies (事務用品)」「Technology (電子製品)」を一つずつクリックして製品カテゴリー(Category)別売上にどのようなパターンがあるのか確認してみましょう。
  • ついでに、X軸に月別の周期の代わりに曜日別の周期の「Order Date - 曜日」を選択すると、月火水木金土日の曜日ごとに売上がどのように違うのか確認することができます。

0:00
/0:42

時間というのは、私たちが直接的な制御力を行使することはできませんが、世界と自分のデータをよりよく理解するための主要な次元です。主要な指標が先月と、昨年の同じ月と比較して悪化した場合、その原因を見つけるためにデータを深く掘り下げるのがEDAと言っても過言ではないでしょう。

時間変数を一方向に流れる順序を持つ数値型変数として活用して推移を確認することもできますし、時間変数から月、曜日、時間帯などのカテゴリー特性を抽出して順序を持つカテゴリー型変数として活用することもできるということを覚えておいてください。

💖
HEARTCOUNTは、すべてのビジネスパーソンのための視覚化・分析ツールです。 今すぐGoogleアカウントで無料版にログインして使ってみてください。