はじめに
HRは組織内の人を管理する分野です。それでは、HR Analyticsとは何でしょうか?
簡単に言えば、HR関連の業務でデータに基づいてアプローチする方法を指します。
今日、ビッグデータ、AIなどの新しい技術の発展により、企業は人材の確保と活用方法に大きな変化が生じています。HR分野では、データや統計分析を通じて、より客観的かつ合理的な方法で人材に関する意思決定に HR Analyticsを活用しており、これにより、データに基づいた意思決定を行うことで、より正しい判断ができるようになります
今回のブログでは、実習用のHRデータセットを利用して、HR Analyticsの例を紹介したいと思います。
Analysis in HEARTCOUNT
データセット: HR(人事)データセット
HRデータといえば思い浮かべることができる、最も一般的に見られるHRの変数から構成されたサンプルデータです。
主な変数を見ると、
- 採用経路: 公募、インターン、産学連携、海外
- チーム区分: マーケティングチーム、技術チーム、生産チーム、事業チームなど
- 退職区分: はい、いいえ
- 勤続期間
- パフォーマンススコア
📎データセットのダウンロード
分析
視覚化機能は無料です! 👉 今すぐ始める
業務に必要な変数のみをまとめたダッシュボードを設定する
ダッシュボードでは、ユーザーが登録したKPIの平均などの要約情報を確認することができます。
<手順>
KPI管理 > ダッシュボード
設定したKPIの平均、合計、比率などの要約結果を確認することができます。
(* Kは1,000を意味します)
従業員満足度に対してどのような要因が最も大きかったのか?
変数間の関係を回帰分析の結果として表す要因分析機能で、従業員満足度と残りの変数間との関係性を探索してみましょう。
<手順>
- 要因分析でKPI(従業員満足度)を選択した後、[分析する] ボタンをクリックします。
- 決定係数(R^2)が高い順に、どの独立変数が従属変数(KPI、従業員満足度)に大きな影響を与えたかを確認することができます。
- 要因となる1つの変数、または2つの変数の組み合わせで回帰分析結果を確認することができます。
<分析結果の解釈>
- 「従業員満足度」を最もよく説明するのは、決定係数(R^2)が0.803で最も高い「チーム区分」と「退職区分」の変数の組み合わせであり、「従業員満足度」の差(変化量)のうち80%を「チーム区分」と「退職区分」で説明することができます。
→ 「自分たちの会社の従業員の満足度に最も影響を及ぼしたのは「どのチームに属しているか」と「退職の有無」だったのですね!」 - 要因となる独立変数が1つしかない単純回帰分析の場合、「マネージャー_コミュニケーション_bin」が最も説明力が高いことがわかります。 (74.8%)
- より詳しく知りたい分析結果をクリックすると、以下のような視覚化画面が表示されます。参考にして、その変数が具体的にKPIにどのような変化を与えたのか、パターンを発見することができます。以下のスクリーンショットを見ると、マネージャーのコミュニケーション力が高い区間ほど、従業員満足度が上昇していることが分かります。
パフォーマンススコアを最適化するためのルールを知る
従業員のパフォーマンススコアを最適化したい場合は、パフォーマンススコアの上位グループと下位グループの統計的特徴を比較してパターンを発見することをお勧めします。セグメンテーションで自動的に提示される、比較したい2つのグループが区別されるルールを信頼度(純度)の高い順に参考にしてみてください。
<手順>
- セグメンテーションで最適化したい変数(パフォーマンススコア)を選択した後、[分析する] ボタンをクリックします。
- 自動的にパフォーマンススコアの上位(top)20%のグループと下位(bottom)20%グループが生成されます。 (* ユーザーが直接ターゲットグループを細かく設定することも可能です)。
<分析結果の解釈>
- パフォーマンススコア上位20%に分類されるルール
→ 未取得_休暇日数 < 12.5、従業員満足度 ≥ 44.6、本人_忍耐力 ≥ 71.5、職種 = [マーケティング・営業、研究開発]。 - 成果点数下位20%に分類されるルール
→未取得_休暇日数 ≥ 12.5、事業所所在地 = [ベトナム、日本、中国、米国、韓国(本社)] - 視覚化グラフを使うと、上位20%(青色)と下位20%(赤色)グループのルールを階層的に確認することができます。
- 右上のボタンで、決定木(デシジョンツリー)の形式で確認することも可能です。
条件を満たすグループ同士を区画する機械学習アルゴリズムです。
パフォーマンススコア上位グループと下位グループの主な特徴は何ですか?
上で比較した2つのグループをより視覚的に比較してみましょう。比較分析機能により、2つのグループがどの変数で異質なのか、各グループの主な特徴は何であるのかを一目で確認することができます。
<手順>
- 比較分析で統計的特徴を比較する任意の2つのグループ(グループAとグループB)を設定します。
- 既存のカテゴリやHEARTCOUNTで自動生成された派生変数を利用することもでき、区間設定、他の変数の追加など、ユーザーが直接グループをカスタマイズすることができます。
- 右上の [比較] ボタンをクリックすると、分析条件で設定された2つのグループ間の最も大きな統計的特徴の違い(差)を示す変数と、その変数に関連する各グループの主要な特徴が降順で表示されます。
<分析結果の解釈>
- グループAは青色、グループBはピンク色で表現されたグラフによって、2つのグループがどの区間で重なるか簡単に確認することができます。
- パーセンテージで表示される数値(2つの色のグラフが重ならない範囲)を用いると、2つのグループがその変数でどの程度異なるのかを確認することができます。
- 両側の統計的特徴が記載されている列により、グループAとBはその変数でそれぞれどのような特徴をより多く持っているか確認することができます。
- 以下の例を見ると、マーケティングチームでパフォーマンススコアの下位グループと上位グループを比較分析したところ、「売上高」全体で54.35%が重ならず、実際に売上が低い(左側)区間ではパフォーマンススコアの下位グループである青色のグラフが多く占めていることが確認できます。
従業員満足度とパフォーマンススコアはどのような相関関係があるのか? グラフで検証する
相関関係は、通常、2つの数値型変数が互いにどの程度、どのような形で影響を与えるかを調べるために使用します。HEARTCOUNTでは、視覚化機能であるスマートプロットで確認することができます。
<手順>
- スマートプロットでX軸に「パフォーマンススコア」、Y軸に「従業員満足度」を設定します。
- X軸とY軸の両方が数値型変数であるため、トレンドラインとヒートマップを使用して個々のレコード(点)の分布と相関関係を確認することができます。
<分析結果の解釈>
- 相関係数により、2つの変数が互いにどのような影響を与えるか(線形関係に近いか)を知ることができます。相関係数(r)は、絶対値が1に近いほど2つの変数間の相関関係が高く、比例して増加または減少する線形的な関係を意味します。
- 従業員満足度とパフォーマンススコアは相関係数が0.21であり、普通の正の相関関係を示しています。
- ヒートマップにより、レコードの分布状態を確認することができます。 (レコード数が多いほど色が濃くなります)
ある変数と残りの全ての変数間の相関関係に関心がある場合は、スモールマルチプルで簡単に確認することができます。