이 글은 본 커뮤니티에서 운영하는 집중 교육 캠프, 데이터 히어로 캠프 3기 참여자이신 이한울님이 작성한 분석 사례입니다. 데이터 히어로에 대한 자세한 내용은 여기를 클릭해주세요.
IBM의 데이터 과학자들이 생성한 가상의 HR Data-set이지만, 본 Data를 통해서 HR Analysis에 대해 직접적으로 체험할 수 있을 것이라 기대하여 제출합니다. 특히, ‘퇴사여부’와 다른 변수들을 제공하기에 HRA의 EDA 연습에 최적일 것이라 선택하게 되었습니다.
Intro
지난 2022년 7월 31일, 파이낸셜 뉴스에서는 국내 제조 대기업들이 공시한 지속가능경영보고서(2021~2022)를 분석하여, 국내 대기업 종사자들의 자발적 이직률이 2배 가까이 상승했다고 밝혔으며 특히 30세 미만의 이직률이 가장 높게 나타났다고 밝혔습니다.
• 대기업별 이직률 요약
1) SK 하이닉스
구분 | 전체 | 30세 미만 | 30~50세 | 50세 이상 |
2020 | 2.2% | 3.4% | 1.3% | 1.8% |
2021 | 3.8% | 5.7% | 2.7% | 2.8% |
Gap | +1.6%p | +2.3%p | +1.4%p | +1.0%p |
2) 삼성전자
구분 | 전체 |
2020 | 2.1% |
2021 | 2.4% |
Gap | +0.3%p |
3) LG 이노텍
전체 | 30세 미만 | 30~50세 | 50세 이상 | |
2020 | 3.3% | - | - | - |
2021 | 3.4% | 8.4% | 2.7% | 1.0% |
Gap | +0.1%p |
→ 출처: "연봉 높고 복지 좋은 곳으로"... 2030 '잡 노마드족' 늘었다 - 파이낸셜뉴스 (fnnews.com)
이러한 지표를 통해 한국의 제조 기업들은 인재를 시간과 많은 비용을 투입하여 선발하고 육성하지만, 공들여서 채용한 인재들이 기업을 이탈하여 큰 손실을 보고 있다는 것을 확인할 수 있었습니다.
LG경영연구원의 2004년 자료인 <인재 유지, 이직 관리로부터 시작하라>에서는 이직 비용을 계산해볼 필요가 있다고 제안하고 있습니다. 현재는 계산 방법이 다르겠지만, 2000년대의 미국 기업들은 이직 비용을 “일반적으로 약 2배 … IT 전문 인력의 경우 연봉의 1.8배 … 중간 관리자의 경우 연봉의 2.8배 정도의 비용이 발생하는 것으로 추산하고 있다.”로 계산하고 있음을 확인할 수 있었습니다.
→ 출처: 인재 유지, 이직 관리로부터 시작하라 (링크: consul728-1.PDF (lgbr.co.kr))
또한, 위 기준을 활용하여 2021년 SK 하이닉스의 이직 비용을 연봉의 두 배로 계산한다면, 최소 2,331억원임을 확인할 수 있었습니다. 이는 SK 하이닉스 2021년 당기순이익 9조 6160억원의 약 2.4% 정도에 해당하는 금액입니다.
- 이직 비용 계산식 :
2021년 말 근로자 수(38,352) X 이직률(3.8%) X 예상 평균연봉 (8,000만원, 나이스 평가정보) X 2
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F4c199a3a-4584-465c-b03a-7775066f80b5%2FUntitled.png&blockId=9fc08e26-5651-4164-a8e5-cbede43322fe)
→ 출처: 2022 SK 하이닉스 지속가능경영보고서 (링크: 지속가능경영 < SK hynix)
때문에, HR Analysis를 학습하고 현업에서 직원들을 유지(Retain)하고자 여러 방면으로 힘쓰는 인사쟁이들에게 직원들의 퇴직 요인을 파악하고 예측하는 것은 중요한 활동인 것 같습니다. 이러한 이유에서 IBM의 데이터 과학자들이 만든 가상 HR 데이터 셋을 활용하여 직원 퇴직에 어떤 요소가 가장 영향을 미치고 어떤 관계가 있는지 분석해보고자 합니다.
Dataset
WA_Fn-UseC_-HR-Employee-Attrition.xlsx241.2KBIBM Dataset.docx14.4KB
Analysis in HEARTCOUNT
Ⅰ. 비교 분석
• 가장 먼저, 재직자와 퇴직자에 대한 특징을 비교 분석을 통해 확인해보고자 합니다.
• 퇴직 인원: 전체 1,470명 중 16.12%인 237명이 퇴직했습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Ffa014559-e20e-4f37-a463-8a41b987113b%2FUntitled.png&blockId=eaeb1dc7-f15e-46ad-9545-e0695df2ff66)
많은 요인들 중 그래프 상 주목할 만한 차이가 보이는 요인 위주로 정리해보겠습니다.
#1. 경력
• 1) 총 경력: 총 경력이 0~8.16년 사이의 인원들의 퇴직이 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F0ba5afab-f965-4a10-ba81-78b1d550c71e%2FUntitled.png&blockId=a644cda9-8600-4bea-8391-ab1b8bd04cef)
• 2) 근속년수: 0~3.27년 사이의 인원들의 퇴직이 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fb53525af-60a0-412e-9464-f880e156f108%2FUntitled.png&blockId=d303c379-c8b5-43d6-9c43-60f40df29b3c)
• 3) 나이: 28.43~34.29세 인원들의 퇴직이 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fa1fd3ac7-3e05-4737-ad8b-c9fcdc496eea%2FUntitled.png&blockId=fe57587d-c449-47e1-b894-943232557de0)
#2. 업무 환경 관련
•1) 환경/직무 만족도, 직무 몰입: 만족도와 몰입도은 퇴직 이유와 큰 관련이 없었습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F18ea4fcb-b39f-4374-b747-d70e7bc7d61b%2FUntitled.png&blockId=73c10178-1cc4-4889-8bff-16334b97c0c9)
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fb26aadbc-94d0-4459-b8b3-203edc12bede%2FUntitled.png&blockId=03b2f79a-8f3d-4da2-936e-9d26757d1661)
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F20657cda-bf74-4cf5-8293-9c5521b17a3b%2FUntitled.png&blockId=f1ae60b8-8c18-4ef4-938f-ad480a5367ba)
• 2) 초과 근무: 퇴직자 중 초과 근무를 하는 인원이 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F9fdff49d-0547-4471-867c-35837ecebc5c%2FUntitled.png&blockId=618631d1-5fd2-40a7-a075-9a04c1d2facc)
• 3) 업무 수준: 1~2 수준의 업무를 수행하고 인원 중에서 퇴사자가 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F81b09dd8-0ff2-4f2c-b009-70c769f2b55e%2FUntitled.png&blockId=a654cf7b-b6ee-47c2-98fa-19a1f1e4895d)
#3. 경제적 보수
• 1) 월 급여 수준: 하위 0~20%의 인원 중에서 퇴사자가 많았습니다.
• 월급이 $1,009 ~ $3,721.86 사이인 경우 퇴사자가 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F0fd4e167-28f1-4b77-9bb4-204f016eb1ca%2FUntitled.png&blockId=8b45191c-5481-4b4e-ba08-d328ef374697)
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F1c12c667-8b2c-4d43-859f-a835d6fe4fe4%2FUntitled.png&blockId=70eb3a6b-c501-4509-8d53-7fec3bf87d8d)
• 2) 스톡옵션 수준: 수준이 0 ~ 0.55 정도인 인원 중에서 퇴사자가 많았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F9d98dfa9-cba5-4505-8836-f2d95747f9d1%2FUntitled.png&blockId=5c867cce-dabf-47df-9578-74b50f2ba8e6)
위와 같이 비교 분석 결과, 퇴직 시 나이가 어리고 경력이 낮은 인원 중 업무의 수준이 낮아 경제적 보수가 상대적으로 적은 그룹에서 퇴사가 빈번하게 발생했습니다.
#4. 기타: 직무
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F5a68cda2-b44c-4e14-a4d1-257df59cdc9f%2FUntitled.png&blockId=f75cf3e9-7c65-41a9-afa6-015936078af5)
직무로 구분한다면 위와 같이 Laboratory Technician, Sales Representative, Sales Executive, Human Resource 그룹에서 퇴사가 많이 발생하고 있었습니다.
Ⅱ. 마이크로 세그먼트 분석
퇴직여부 Yes에 영향을 미치는 요인을 정밀하게 분석하고자 설명력 높은 두 그룹을 확인했습니다. (80% 이상)
Group 1. 상대적으로 소득이 적음 - 87.8%
• 초과 근무를 하지 않고, 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원 그룹의 퇴직에 대한 설명력이 높았습니다.
• 이에 퇴직 예측 시 월 소득이 $2,475 미만이며, 일 급여 수준이 $931미만인 직원들에 대해 초점을맞출 필요가 있는 것 같습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F8b0148e2-02e7-4ff2-bbde-48d73551644b%2FUntitled.png&blockId=76577469-672c-4d3c-ab9a-5c0cb489ee5c)
• 초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F18d6c479-1e42-42f3-80ef-3cdeeedeb892%2FUntitled.png&blockId=6a07df98-eb34-4887-b1fb-14360f5ca240)
• 또한 해당 직무 중 퇴직한 직원의 직장과 집의 거리를 확인해보니 평균 거리는 10.18이었습니다. 이직하지 않은 인원의 평균 거리가 8.56이다보니, 직장과 집의 거리가 멀면 멀수록 퇴사할 가능성이 높아지는 것을 예측해볼 수 있습니다.
• 특히, 신뢰 구간이 8.03 ~ 12.33 사이이므로 직장과 집의 거리가 8.03 이상에서 통근하는 직원의 경우 모니터링이 필요할 것으로 보입니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F22266d5a-7142-4271-b130-92deaf5e4e69%2FUntitled.png&blockId=1dd956ce-dd4b-4d62-8c85-1cf12485ec28)
• 퇴직자(2.73)와 재직자(3.48)의 평균 근속 년수가 차이는 미미했지만, 퇴직자 근속 년수의 신뢰구간은 2.03 ~ 3.43이므로 입사 후 2년차~3년 경과된 인원에 대한 모니터링이 필요할 것 같습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F7746a5a4-2d65-4a5c-9c22-ba1f5bde0a02%2FUntitled.png&blockId=730b3acf-b4ac-4e6c-b111-abb02a269ad5)
Summary: 월 소득 $2,475 미만, 일 급여 수준 $931 미만 직원의 퇴사 가능성 예측 지표
• 직무: Sales Representative, Human Resources, Laboratory technician, Research scientist
• 근속 년수: 2.03~3.43 사이
• 통근 거리: 8.03 이상
• 직무 몰입도: 2.57 미만
Group 2. 상대적으로 소득이 높은 그룹 - 80.77%
• 초과 근무를 하지 않고, 월급이 $2,475 이상이며, 스톡옵션 수준이 0.5미만이고, 월급여수준이 $17,036 이상인 직원들 중 직무가 Healthcare representative, Laboratory Technician, Research Scientist 직원 그룹의 퇴직에 대한 설명력이 높았습니다.
![](https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F87710585-d504-4fb3-b46a-b170a2ec0a70%2FUntitled.png&blockId=dede1732-fa99-41ce-a41c-8437f7ffbe99)
• 초과근무 여부를 제외하고 해당 인원들을 확인해본 결과, 해당 직무는 Sales Representative, Human Resources, Laboratory technician, Research scientist 이었습니다. 이에 해당 직무에서 근무하는 인원들을 중점적으로 모니터링해볼 필요가 있을 것 같습니다.