데이터로 세상을 이해하는 법
사업, 세상, 우주 등 삼라만상 모든 것에 대한 과학적 답은 숫자에 있습니다. 그리고, 숫자는 비교를 통해서만 그 의미가 드러납니다. 대상의 양적 크기와 질적 차이가 담긴 숫자는 맥락 속에서 비교될 때 비로소 우리의 인식 속으로 들어올 수 있기 때문입니다. 대상들을 범주로 나누고, 범주 간 속성의 정량적 차이를 확인하여 세상을, 내 사업을 더 잘 이해하게 되는 것이지요. 데이터 시각화는 이런 과학적 인식을 돕기 위한 현대의 발명이겠고요.
숫자를 여러 차원으로 비교하는 일
현대적 의미의 데이터 시각화와 EDA(탐험적 데이터 분석)의 창시자로 추앙되는 존 튜키님이 “하나의 숫자가 모든 걸 말해줄 거라 기대하지 않듯이 하나의 차트가 모든 걸 보여줄 거라 기대하지 말자.”고 이야기했던 것은 복잡한 현실을 추상화하여 그 한 단면만을 보여주는 데이터 시각화에 대한 경계였을 터입니다.
There is no more reason to expect one graph to “tell all” than to expect one number to do the same. by John Tukey
이차원 공간에 놓인 하나의 창 속에 담긴 차트는 하나의 사실, 한가지 측면(단면/Facet)에 대해서만 말하게 하는 편이 옳습니다. 세상의 복잡성을 반영할 의도로, 너무 많은 범주(차원/Dimension)를 한 창에 표현하면 아래 그림처럼 주어진 시각적 정보들을 처리하지 못하는 인지적 과부하(cognitive overload)가 올 수 있기 때문입니다.
Facet Plot
Facet은 다이아몬드와 같은 다면체를 구성하는 각각의 단면들을 지칭하는 용어입니다. 데이터 시각화 맥락에서 Facet Plot은 주어진 데이터셋을 특정 범주를 사용하여 subset을 구성한 후, 각각의 subset을 다이아몬드를 구성하는 개개의 단면들처럼 별도의 창에서 보여주는 방식으로 작동합니다.
Facet Plot의 장점은
• 하나의 차트에 새로운 차원을 색상 등으로 우겨 넣어 보는 사람을 당황하게 하는 일(overplotting)을 피할 수 있음
• 숫자를 여러 차원을 사용하여 비교하는 데 드는 인지적 노력 최소화
Facet Plot의 주창자였던 Edward Tufte는 다음과 같이 이야기했습니다.
At the heart of quantitative reasoning is a single question: Compared to what? by Edward Tufte
“양적 추론에서는 하나의 질문만이 중요하다. 뭐랑 비교해서?”
그럼, HEARTCOUNT의 Facet Plot을 함께 감상하겠습니다.
지금 구글 계정으로 로그인하여 사용해 보세요.