차근차근 시작하는 데이터 분석 (3) 데이터 분석을 위한 툴, 언어 소개

차근차근 시작하는 데이터 분석 (3) 데이터 분석을 위한 툴, 언어 소개

하트카운트팀과 차근차근 시작하는 데이터 분석, 마지막 3편에서는 데이터 분석을 하기 위해 사용하는 툴 및 언어를 소개해 드리려고 해요. 이 글을 통해 데이터 분석에 사용되는 툴의 종류, 효율적인 학습 방법, 추천 학습 콘텐츠 등을 알아보세요.

목차
📌
차근차근 시작하는 데이터 분석 시리즈
1) 샘플 데이터셋 찾기
2) 콘텐츠/서적 추천
3) 데이터 활용 도구/언어 소개

하트카운트팀과 차근차근 시작하는 데이터 분석, 마지막 3편에서는 데이터 분석을 하기 위해 사용하는 툴 및 언어를 소개해 드리려고 해요. 이 글을 통해 데이터 분석에 사용되는 툴의 종류, 효율적인 학습 방법, 추천 학습 콘텐츠 등을 알아보세요.



ABI Tools

ABI는 Analytics&Business Intelligence의 줄임말로, 질문-데이터-분석-인사이트 사이클을 돕는 툴입니다. Analytic은 데이터 사이언티스트가 하면 되는 것 아닌가요? 라고 하신다면 R, Python은 보고용으로 사용하기에는 쉽지 않고, 작성하는데 공도 많이 들어가고, 해석도 어려우니까요. 또,  BI, 내가 그렇게 나쁩니까? 글에서 말씀드렸듯, 대시보드만으로는 단순한 지표(수치) 확인을 넘어서 질문하고 답을 찾는 것까지 나아가는데는 부족함이 있을 거예요.

그래서 ABI를 한번에 해결할 수 있는 이런 툴들을 사용합니다.

  • 💖 하트카운트 HEARTCOUNT ABI: HEARTCOUNT는 모든 현업을 위한 데이터 분석 솔루션입니다.  단순히 대시보드에서 현황과 추이를 파악하는 것을 넘어서, 분석 기능을 사용해 사용자의 질문에 대한 답변을 찾을 수 있는 Analytics & BI 플랫폼입니다.
  • 🌐 PowerBI: Microsoft에서 개발한 비즈니스 인텔리전스 도구로, Microsoft 생태계와 통합된 대화형 대시보드 및 보고서를 생성하여 기업 사용자가 데이터 기반 의사결정을 지원할 수 있게 해주는 비즈니스 인텔리전스 솔루션입니다.
  • 🌐 Tableau : 수동으로 Analytics를 할 수 있는 대표적인 툴인 Tableau는 드래그 앤 드롭 인터페이스를 통해 사용자가 직관적으로 데이터를 시각화하고 탐색할 수 있도록 지원하는 데이터 분석 및 시각화 도구입니다.
💡
글로벌 기업들이 어떻게 Analytics/BI 도구에 거대 언어모델(LLM)을 통합하고 있는지, HEARTCOUNT와는 어떤 차이가 있는지 그 현황과 앞으로의 전망이 궁금하신 분들은 LLM 상용화의 홍수 속에서 살펴 보는 Self-service Analytics 시장의 흐름 글을 참고해보세요.


파이썬

Python은 NumPy, pandas, Matplotlib 및 Scikit-learn 등 데이터 분석과 머신러닝 작업을 용이하게 해주는 라이브러리 덕분에, 데이터 과학 분야에서 매우 인기 있는 프로그래밍 언어입니다. Jupyter Notebook을 통해 코드와 함께 시각적 결과를 담은 보고서를 작성할 수 있는 장점도 있습니다. Python을 학습할 때는 공식 문서와 더불어 다양한 커뮤니티 자료를 활용하면 좋습니다.

📌
하트카운트 프리미엄 사용자라면, '파이썬 입문 & 데이터 전처리' 강의를 평생 무료로 소장하여 들으실 수 있습니다. ( 무료로 이용하는 방법 알아보기 )
  • 📺 유튜브 PyCon Korea: 오프라인 파이콘 행사의 공개된 발표 영상 모음입니다. Python 커뮤니티와 함께 다양한 주제를 탐구해보세요.
  • 📺 (영문) 유튜브 Real Python: 파이썬 공부에 도움을 주는 채널로, 뉴스레터도 제공합니다.
  • 🌐 (영문) 공식문서 PEP: Python Enhancement Proposals : 파이썬 제작자들이 제안하는 파이썬 사용 가이드입니다.
  • 🌐 jehyunlee 님의 블로그 : 파이썬 시각화 라이브러리 'matplotlib' 사용 방법이 잘 정리된 블로그입니다.  혼란한 Matplotlib에서 질서 찾기 게시글을 추천합니다.


R

벡터 계산에 강점이 있는 R은 기본 패키지에도 충분한 계산 방식을 내장하고 있어 데이터 분석이 용이합니다. 마크다운 문법을 활용해 보고서를 만들 수 있는 점도 장점입니다. R을 학습하실 때는 공식문서 위주로 익히는 것을 추천드립니다.

  • 📒 해들리 위컴의 Advanced R : R 사용의 심화 학습서입니다.
  • 📒 R for Data Science: 데이터 과학을 위한 R 학습서입니다.
  • 🌐 tidyverse [cran] [homapage]: R을 사용한 데이터 전처리, 분석, 시각화 그리고 이를 위한 병렬처리 등이 설계된 패키지 모음으로, tidyverse를 사용하면 데이터 분석을 더욱 효율적이고 직관적으로 수행할 수 있습니다.
  • 🌐 caret [cran] [github] : Classification and Regression training의 줄임말로, R에서 분류 및 회귀 모델을 훈련하고 시각화하기 위한 다양한 기능을 제공하는 머신러닝 프레임워크입니다.
    (참고) R에서 사용할 수 있는 머신러닝 패키지 목록은 여기에서 확인할 수 있습니다.


ChatGPT 활용 방법

데이터 분석에서도 ChatGPT를 유용하게 활용할 수 있습니다. 데이터 분석 시나리오 작성, 데이터 전처리 등의 다양한 용도로 사용할 수 있으며 단순 반복 작업을 대신 해주어 시간을 절약할 수 있습니다.

각 툴과 언어의 특성을 이해하고, 추천 학습 자료를 통해 실력을 향상시켜 보세요.



HEARTCOUNT

누구나 데이터 분석가가 될 수 있는 툴, HEARTCOUNT(공식 소개글)도 사용해 보세요. 테이블 형태의 엑셀 데이터셋을 올려 다양한 시각화 차트 완성 및 데이터 탐험, 비즈니스 의사 결정에 도움이 되는 통계적 분석을 수행할 수 있습니다. 최근 추가된 AI 분석 기능을 통해 주어진 데이터셋에 대한 추천 질문을 제안 받을 수 있으며 초보자도 쉽게 이해할 수 있는 시각화 차트 및 해석을 제공합니다. 지금 무료로 사용해 보세요.

💖
AI 분석이 더해져 더욱더 쉽고 편리해진 HEARTCOUNT을 만나 보세요. 데이터 분석이 막막했던 여러분에게 새로운 길을 제시합니다
지금 사용해보기