[고객 사례] 보험사 데이터 활용 사례, 이상치 발견하기

[고객 사례] 보험사 데이터 활용 사례, 이상치 발견하기

목차

Intro

보험사와 금융 업계에서는 평소와 달리 튀는 데이터를 빠르고 정확하게 파악하는 것이 매우 중요합니다. 그래서 데이터를 모니터링하기 위한 대시보드 활용이 해당 업계에서는 일반화되었습니다.

그런데 정말 이것만으로 보험사와 금융 업계의 데이터 니즈를 충족할 수 있을까요? 대시보드를 통해 데이터의 변화는 빠르게 발견할 수 있겠지만 그 원인을 파악하기 위해서는 추가적인 심화 분석이 필요합니다.

본문에서는 대시보드와 분석 기능이 결합된 HEARTCOUNT ABI를 활용하여, 원하는 분석에 성공한 A 손해보험사의 사례를 다루겠습니다.

Analysis in HEARTCOUNT ABI

Dataset

보안상의 이유로 실제 데이터셋을 임의로 편집, 재구성한 데이터셋을 활용하였습니다.

Analysis

1. 대시보드를 보다가 데이터로부터 알고 싶은 주제 발견

전반적인 보험금 지급 현황을 알 수 있도록 대시보드를 임의로 구성하였습니다.

<질문 생성>

  • 지역별 평균최종보험금 차트를 보니 21년 12월에 유난히 많은 보험금이 지출된 건이 발견되었습니다.
  • 해당 시점을 포함하여 전달, 다음달만 표시되도록 필터를 걸었습니다.
  • 확인 결과, 모든 지역에서 12월 보험금이 증가하는 추이가 보였으나 유난히 J지역이 눈에 띄게 많은 지출액이 있었습니다. 어떤 이유였을까요?
  • 차트 오른쪽 위에 있는 ‘하트로고’를 클릭해 분석 기능으로 이동합니다.

2. J지역의 변수별 랭킹 분석

<레시피>

  • 스마트플롯 페이지에 대시보드와 동일한 차트가 그려졌습니다. 먼저 궁금한 시점은 12월이기 때문에 해당하는 데이터만 남도록 필터링하겠습니다.
  • 이제 스마트 랭킹 기능을 이용해서 J지역에 해당하는 값들이 모든 변수에서 몇 위를 차지하는지 살펴 보겠습니다.
  • 아래 이미지를 살펴 보니, 레코드 숫자를 포함하여 견인비, 보험비, 부품비, 수리비, 최종보험비로 구성된 모든 비용 항목에서 가장 높은 순위에 있는 것이 확인됩니다.
  • 이제 J 지역만 나타나도록 필터를 걸고 Ranking의 기준을 ‘보상지역_상세’로 변경합니다.
  • 추가적으로 분석에 혼선이 없도록 당연히 비용이 높게 나오는 외제차 항목은 제거하도록 하겠습니다.
  • 레코드 수가 가장 많은 ‘J_6’ 지역은 평균 최종 보험비 항목에서는 2위를 차지하고 있습니다.
  • 한편 ‘J_3’ 지역은 다른 비용은 중상위권인 반면, 부품비가 가장 상위에 있으며 최종보험비 역시 가장 높았던 것으로 나타납니다.

<분석 결과 해석>

  • ‘J_3’ 지역에서 부품비가 유난히 많이 지출되어서 결국 최종보험비도 가장 높게 나타난 것으로 예상이 됩니다. 그 원인을 파악하기 위해서 이제 집계값이 아니라 더 상세하게 개별 레코드 수준의 분석을 통해 살펴 보겠습니다.

3. 개별 레코드 수준의 심화 분석을 통한 이상치 발견

<레시피>

  • 다시 스마트플롯 기능으로 돌아와 상세 보상지역별 부품비를 개별 레코드 수준에서 시각화하였습니다.

<분석 결과 해석>

  • ‘J_3’ 지역을 보니 유난히 눈에 띄는 포인트가 하나 보입니다. 이 보상 건이 J_3 지역의 평균 부품비를 높인 것으로 판단됩니다. 이 포인트가 무엇인지 자세히 알아 보겠습니다.

4. 이상치의 원인 파악

  • 차량 종류에 따라서 색상을 구분하였습니다.
  • 문제의 포인트는 ‘차량종류명: 덤프트럭’이었습니다. 덤프트럭이라면 부품비가 많이 나왔을 수 있을 거라고 예상이 되지만, 확실한 확인을 위해 덤프트럭의 다른 보상 건과 비교해 보도록 하겠습니다.
  • 다른 필터를 다 삭제하고 덤프트럭만 표시되도록 필터를 겁니다.
  • 덤프트럭만 표시한 결과, J_3 지역의 해당 보상 건은 여전히 비정상적으로 높은 부품비가 책정된 것이 확인됩니다.
  • 혹시 너무 큰 사고가 났던 것은 아닐까요? 사고의 유형에 따라서 색상을 구분해 보았습니다.
  • 시각화 결과를 보니, ‘사고유형: 주정차 사고’였던 것으로 파악됩니다.
  • 이번에는 손해정도에 따라서 색상을 구분해 보겠습니다.
  • 손해정도는 전체손해와 부분손해 중 부분손해인 것으로 확인되었습니다.

<분석 결과 해석>

  • 이상치의 원인으로 보이는 포인트는 차량 종류가 덤프트럭이었습니다. 다른 덤프트럭 보상건과 비교해 봤을 때에도 유난히 높은 금액의 보상금이 지급되었으나, 상세 분석을 해보니 사고의 유형은 주정차 사고였고 손해 정도도 부분 손해로 나타났습니다.
  • 이 분석 결과로 무조건 보험금이 이상 지급되었다고 판단할 수는 없지만, 추가 확인을 위한 실마리를 얻었다고 볼 수 있겠습니다.

본 아티클에 대한 추가적인 질문/의견은 HEARTCOUNT 커뮤니티 슬랙 채널에 남겨주시면 답변드리겠습니다. :)