IBM HR Analytics employee attrition & performance

IBM HR Analytics employee attrition & performance

집중 교육 캠프, 데이터 히어로 캠프 3기 참여자의 분석 사례입니다. IBM 데이터 과학자들이 생성한 HR 데이터를 활용한 HR 분석이 궁금하시다면 확인해 보세요!

목차
이 글은 본 커뮤니티에서 운영하는 집중 교육 캠프, 데이터 히어로 캠프 3기 참여자이신 이한울님이 작성한 분석 사례입니다. 데이터 히어로에 대한 자세한 내용은 여기를 클릭해주세요.

주제 선정 배경:
IBM의 데이터 과학자들이 생성한 가상의 HR Data-set이지만, 본 Data를 통해서 HR Analysis에 대해 직접적으로 체험할 수 있을 것이라 기대하여 제출합니다. 특히, ‘퇴사여부’와 다른 변수들을 제공하기에 HRA의 EDA 연습에 최적일 것이라 선택하게 되었습니다.

Intro

지난 2022년 7월 31일, 파이낸셜 뉴스에서는 국내 제조 대기업들이 공시한 지속가능경영보고서(2021~2022)를 분석하여, 국내 대기업 종사자들의 자발적 이직률이 2배 가까이 상승했다고 밝혔으며 특히 30세 미만의 이직률이 가장 높게 나타났다고 밝혔습니다.

• 대기업별 이직률 요약
1) SK 하이닉스

구분
전체
30세 미만
30~50세
50세 이상
2020
2.2%
3.4%
1.3%
1.8%
2021
3.8%
5.7%
2.7%
2.8%
Gap
+1.6%p
+2.3%p
+1.4%p
+1.0%p

2) 삼성전자

구분
전체
2020
2.1%
2021
2.4%
Gap
+0.3%p

3) LG 이노텍

전체
30세 미만
30~50세
50세 이상
2020
3.3%
-
-
-
2021
3.4%
8.4%
2.7%
1.0%
Gap
+0.1%p

→ 출처: "연봉 높고 복지 좋은 곳으로"... 2030 '잡 노마드족' 늘었다 - 파이낸셜뉴스 (fnnews.com)

이러한 지표를 통해 한국의 제조 기업들은 인재를 시간과 많은 비용을 투입하여 선발하고 육성하지만, 공들여서 채용한 인재들이 기업을 이탈하여 큰 손실을 보고 있다는 것을 확인할 수 있었습니다.

LG경영연구원의 2004년 자료인 <인재 유지, 이직 관리로부터 시작하라>에서는 이직 비용을 계산해볼 필요가 있다고 제안하고 있습니다. 현재는 계산 방법이 다르겠지만, 2000년대의 미국 기업들은 이직 비용을 “일반적으로 약 2배 … IT 전문 인력의 경우 연봉의 1.8배 … 중간 관리자의 경우 연봉의 2.8배 정도의 비용이 발생하는 것으로 추산하고 있다.”로 계산하고 있음을 확인할 수 있었습니다.
→ 출처: 인재 유지, 이직 관리로부터 시작하라 (링크: consul728-1.PDF (lgbr.co.kr))

또한, 위 기준을 활용하여 2021년 SK 하이닉스의 이직 비용을 연봉의 두 배로 계산한다면, 최소 2,331억원임을 확인할 수 있었습니다. 이는 SK 하이닉스 2021년 당기순이익 9조 6160억원의 약 2.4% 정도에 해당하는 금액입니다.
- 이직 비용 계산식 :
2021년 말 근로자 수(38,352) X 이직률(3.8%) X 예상 평균연봉 (8,000만원, 나이스 평가정보) X 2

→ 출처: 2022 SK 하이닉스 지속가능경영보고서 (링크: 지속가능경영 < SK hynix)

때문에, HR Analysis를 학습하고 현업에서 직원들을 유지(Retain)하고자 여러 방면으로 힘쓰는 인사쟁이들에게 직원들의 퇴직 요인을 파악하고 예측하는 것은 중요한 활동인 것 같습니다. 이러한 이유에서 IBM의 데이터 과학자들이 만든 가상 HR 데이터 셋을 활용하여 직원 퇴직에 어떤 요소가 가장 영향을 미치고 어떤 관계가 있는지 분석해보고자 합니다.

Dataset

WA_Fn-UseC_-HR-Employee-Attrition.xlsx241.2KBIBM Dataset.docx14.4KB

Analysis in HEARTCOUNT

Ⅰ. 비교 분석


• 가장 먼저, 재직자와 퇴직자에 대한 특징을 비교 분석을 통해 확인해보고자 합니다.
• 퇴직 인원: 전체 1,470명 중 16.12%인 237명이 퇴직했습니다.

많은 요인들 중 그래프 상 주목할 만한 차이가 보이는 요인 위주로 정리해보겠습니다.

#1. 경력
• 1) 총 경력: 총 경력이 0~8.16년 사이의 인원들의 퇴직이 많았습니다.

• 2) 근속년수: 0~3.27년 사이의 인원들의 퇴직이 많았습니다.

• 3) 나이: 28.43~34.29세 인원들의 퇴직이 많았습니다.

#2. 업무 환경 관련
•1) 환경/직무 만족도, 직무 몰입: 만족도와 몰입도은 퇴직 이유와 큰 관련이 없었습니다.

• 2) 초과 근무: 퇴직자 중 초과 근무를 하는 인원이 많았습니다.

• 3) 업무 수준: 1~2 수준의 업무를 수행하고 인원 중에서 퇴사자가 많았습니다.

#3. 경제적 보수
• 1) 월 급여 수준: 하위 0~20%의 인원 중에서 퇴사자가 많았습니다.
• 월급이 $1,009 ~ $3,721.86 사이인 경우 퇴사자가 많았습니다.

• 2) 스톡옵션 수준: 수준이 0 ~ 0.55 정도인 인원 중에서 퇴사자가 많았습니다.

위와 같이 비교 분석 결과, 퇴직 시 나이가 어리고 경력이 낮은 인원 중 업무의 수준이 낮아 경제적 보수가 상대적으로 적은 그룹에서 퇴사가 빈번하게 발생했습니다.

#4.  기타: 직무

직무로 구분한다면 위와 같이 Laboratory Technician, Sales Representative, Sales Executive, Human Resource 그룹에서 퇴사가 많이 발생하고 있었습니다.

Ⅱ. 마이크로 세그먼트 분석

퇴직여부 Yes에 영향을 미치는 요인을 정밀하게 분석하고자 설명력 높은 두 그룹을 확인했습니다. (80% 이상)

Group 1. 상대적으로 소득이 적음 - 87.8%
• 초과 근무를 하지 않고, 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원 그룹의 퇴직에 대한 설명력이 높았습니다.
• 이에 퇴직 예측 시 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원들에 대해 초점을맞출 필요가 있는 것 같습니다.

• 초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.

• 또한 해당 직무 중 퇴직한 직원의 직장과 집의 거리를 확인해보니 평균 거리는 10.18이었습니다. 이직하지 않은 인원의 평균 거리가 8.56이다보니, 직장과 집의 거리가 멀면 멀수록 퇴사할 가능성이 높아지는 것을 예측해볼 수 있습니다.
• 특히, 신뢰 구간이 8.03 ~ 12.33 사이이므로 직장과 집의 거리가 8.03 이상에서 통근하는 직원의 경우 모니터링이 필요할 것으로 보입니다.

• 퇴직자(2.73)와 재직자(3.48)의 평균 근속 년수가 차이는 미미했지만, 퇴직자 근속 년수의 신뢰구간은 2.03 ~ 3.43이므로 입사 후 2년차~3년 경과된 인원에 대한 모니터링이 필요할 것 같습니다.

Summary: 월 소득 $2,475 미만, 일 급여 수준 $931 미만 직원의 퇴사 가능성 예측 지표
• 직무: Sales Representative, Human Resources, Laboratory technician, Research scientist
• 근속 년수: 2.03~3.43 사이
• 통근 거리: 8.03 이상
• 직무 몰입도: 2.57 미만

Group 2. 상대적으로 소득이 높은 그룹 - 80.77%
• 초과 근무를 하지 않고, 월급이 $2,475 이상이며, 스톡옵션 수준이 0.5미만이고, 월급여수준이 $17,036 이상인 직원들 중 직무가 Healthcare representative, Laboratory Technician, Research Scientist 직원 그룹의 퇴직에 대한 설명력이 높았습니다.

• 초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.