LLM 상용화의 홍수 속에서 살펴 보는 Self-service Analytics 시장의 흐름

LLM 상용화의 홍수 속에서 살펴 보는 Self-service Analytics 시장의 흐름

2023년에는 거대 언어모델(LLM)의 상용화와 함께 Self-serve Analytics/BI 시장에 많은 변화가 있었습니다. 시장에 있었던 변화를 톺아보고, 앞으로의 전망을 함께 살펴봅시다.

목차
📌
이런 분들께 추천합니다.
1. LLM(거대 언어 모델)생성형 AI가 데이터 산업에서 어떻게 쓰이는지 최신 동향을 알아보고 싶으신 분
2. 실무자가 데이터 전문가의 도움 없이도 스스로 분석할 수 있도록 돕는 Self-service Analytics/BI 툴에 관심 있으신 분
3. 대표적인 Self-Service Analytics 플레이어인 태블로, 파워BI. HEARTCOUNT 등이 LLM을 어떻게 제품에 상용화시키고 있는지 알아보고자 하는 분

들어가며: 데이터 민주화와 Self-service Analytics

기업의 데이터 리터러시 및 데이터 활용 수준을 증진하기 위해서 Self-service Analytics/BI의 필요성은 나날이 늘어나고 있습니다.

💡
Self-service Analytics/BI 란?
현업 사용자가 IT 부서의 도움 없이 직접 데이터를 활용하여 차트를 그리고 인사이트를 도출하고 변화를 모니터링하는 BI 컨셉

기업에서 생산되고 적재되는 수많은 데이터가 소수의 데이터 인력에 의해서만 소비되는 현상을 방지하고, 구성원 모두가 데이터로부터 가치를 창출하는 데이터 민주화를 위해 많은 기업들이 Self-service Analytics/BI를 도입하고 있는데요.

2023년에는 특별히 거대 언어모델의 상용화와 함께 Self-service Analytics 시장의 플레이어들에게도 많은 변화가 있었습니다. 어떠한 일들이 있었는지 함께 살펴보고, 24년에는 어떠한 변화들이 기대되는지 함께 살펴보시죠!

Self-service Analytics 시장 전반

성장하는 Self-service Analytics 시장

데이터 시장이 날이 갈수록 성장함에 따라, Self-service Analytics, Self-service BI 시장도 함께 성장해가는 모양새입니다. Fortune Business Insights의 리서치 결과에 따르면, 2022년 기준으로 Self-service Analytics/BI 시장의 규모는 약 48.8억 달러 수준이며, 2030년까지 200억 달러 규모의 시장을 형성할 것으로 예측된다고 합니다. 또한, 가트너에 따르면 2024년까지 기업 중 75%가 Self-service Analytics/BI를 도입할 것이라고 하네요.

Self-service Analytics 키 플레이어

Self-service Analytics 시장의 가장 핵심 플레이어는 Power BI와 Tableau입니다. TrustRadius에서 21년에 발표한 자료에 따르면, Power BI와 Tableau는 각각 36%, 20%로 도합 절반이 넘는 시장 점유율을 보이고 있다고 합니다.

출처: https://solutions.trustradius.com/vendor-blog/business-intelligence-statistics-and-trends/

또한, 가트너는 작년 5월 23일에 <Magic Quadrant for Analytics and Business Intelligence Platforms>라는 글을, 포레스터는 작년 6월 13일에 <The Forrester Wave™: Augmented Business Intelligence Platforms, Q2 2023>라는 글을 통해 시장의 핵심 제품들을 각자의 기준으로 분류했습니다.

출처: https://www.gartner.com/doc/reprints?id=1-2CF2LJQ8&ct=230130&st=sb

가트너는 Magic Quadrant라는 일사분면으로 시장의 제품들을 분류했습니다. 시장의 리더로는 Microsoft(Power BI), Salesforce(Tableau), Qlik(Qlik View, Qlik Sense)가 자리하고 있네요. 이외에 Augmented Analytics(증강 분석, 인공지능 및 머신러닝 기술 등을 활용하여 사용자의 분석 능력을 증강하는 컨셉/철학을 의미) 시장의 강자인 Thoughtspot 및 Sisense, 기존 시장 입지를 공고화하고 있는 Oracle, IBM, SAP 및 SAS 등이 Visionaries(‘차별화된 비젼’을 가진 제품)를 차지하고 있습니다. Challengers(시장에서 자리를 잘 잡았지만 Use case/Application이 제한되어 있는 제품들)로는 Google Looker, MSTR, AWS 등이 있네요.

시장 핵심 추이

LLM의 출현과 BI + Augmented Analytics

23년 데이터 산업/시장의 가장 뜨거운 감자는 뭐니뭐니해도 대형 언어모델(Large Language Model, LLM)입니다. OpenAI의 ChatGPT와 GPT 3.5가 상용화의 출발선을 끊었고, 이후로 거대 테크 기업들이 줄줄이 자신들의 모델을 내놓았습니다. 또한, 허깅페이스 등을 통한 Open Source LLM의 인기몰이를 통해 각 기업들은 각자의 비즈니스에 LLM을 도입하기 위해 박차를 가하고 있습니다.

Self-service Analytics 시장도 예외는 아닙니다. 키 플레이어들은 너나 할 것 없이 LLM을 각자의 제품에 결합하고 있습니다. 이러한 현상으로 인해 시장에서 발생한 가장 큰 변화는 Self-service Analytics 제품과 Augmented Analytics 제품의 경계가 점차 흐려지고 있다는 것입니다. 기존 Self-service Analytics를 표방하던 제품들은 대부분 BI의 성격을 가지고 있었는데요. LLM의 등장에 따라, 사용자가 기존에 개발된 기능들에 자연어를 기반으로 손쉽게 접근하고 또 활용할 수 있게 되었습니다. 핵심 플레이어들의 몇 가지 사례들을 살펴 볼까요?

Tableau: Tableau GPT & Tableau Signal

Tableau는 Salesforce의 다른 제품인 Einstein Discovery에 기존 개발되어 있던 Einstein GPT를 Tableau와 결합했습니다. 아직 상용 공개되지 않아 실체를 확인할 수는 없지만, 핵심적인 기능으로 내세우고 있는 것은 1. 데이터 조작/준비 솔루션인 Tableau Prep에서 자연어로 입력한 요구사항을 SQL화 하는 기능 2. 지표의 핵심적인 변화를 자동으로 파악하고 자연어로 해석하는 기능(Pulse) 3. 자연어로 입력한 분석 질문에 대한 적절한 시각화와 해석을 제공하는 기능(Pulse Q&A)이 있습니다. 현재는 클로즈드 베타 중이며, 2월 14일부터 베타 버젼을 클라우드 고객들에게 무상 제공한다고 하네요.

PowerBI: Copilot

MS는 이미 자사의 여러 제품들에 Copilot(GPT-4 기반)을 결합한 바 있죠. Power BI도 그 중 하나가 되었는데요. PowerBI Copilot이 제공하는 기능의 범위도 Tableau와 유사합니다. 사용자가 자연어로 '이런 대시보드를 만들고 싶어'라고 입력 시 거기에 알맞는 차트를 직접 뚝딱 만들어서 대시보드화하는 기능, 대시보드에서 궁금한 내용을 자연어로 질문하면 적절한 해석을 도출해주는 기능, 자연어로 궁금한 내용을 입력하면 PowerBI만의 고유한 데이터 분석 언어인 DAX(Data Analysis Expression)로 변환해주는 기능 등이 있습니다.

그 외 제품들

Thoughtspot: Thoughtspot은 LLM이 등장하기 전에도 NLP(자연어 처리, Natural Language Processing)를 기반으로 한 증강형 분석 시장의 강자였는데요. LLM의 등장에 따라 Thoughtspot도 GPT-3를 결합한 Sage를 출시했습니다. 사용자의 자연어 질문에 대한 적절한 시각화 및 자연어 요약 기능을 제공합니다.

Microstrategy: Microstrategy 또한 LLM을 결합한 Microstategy AI를 지난 10월에 세상에 공개했습니다. LLM 기반 자동 정답 제공, 자동 대시보드 형성, 자동 SQL 생성 등의 기능을 제공한다고 합니다.

Introducing MicroStrategy AI: Generative AI on Trusted Data
October 3, 2023

Qlik Sense: Self-service Analytics계의 또 다른 강자 중 하나인 Qlik Sense 또한 LLM을 결합한 Insight Advisor를 출시했습니다. 사용자가 입력한 자연어 질문에 대한 시각화와 설명을 제시하고, 결과물을 MS Chat을 통해 조직의 다른 구성원과 공유할 수 있습니다.

치열한 LLM 전쟁 속에서 잠시 숨 고르기

지금까지 함께 살펴보셨듯이, 거대 언어 모델의 영향력은 Self-service Analytics 시장 전반을 뒤흔들고 있습니다. 시장의 모든 플레이어가 LLM을 도입하고, 경쟁하는 것을 보면 생성형 AI가 갈수록 '표준'이 되어가고 있다는 생각이 드네요. 그럼에도 불구하고, 이 치열한 경쟁 속에서 잠시 숨을 고르고, 화려하고 강력해 보이는 LLM의 이면을 들여다 볼 필요가 있겠습니다.

#1. LLM이 기존의 모든 것을 대체할 수는 없다

잠시 옆길로 새었다가 올까요? 약 2주 전, Rabbit이라는 회사에서 Rabbit 1이라는 신제품의 데모 영상을 공개했습니다. 영상을 공개한지 10일 만에 무려 460만이 넘는 조회수를 기록하며, 시장의 이목을 집중시키고 있는데요. 이 제품은 바로 생성형 AI기술을 극대화하여, 기존의 스마트폰을 대체하겠다는 야심찬 비전을 제시하고 있습니다.

시장의 반응도 가지각색입니다. 제품이 보여주는 놀라운 성능(이미지 인식, 음성 인식, LLM)과 미래지향적인 UX는 분명히 괄목할 만 하지만, 과연 기존의 스마트폰을 대체할 수 있을지 회의적이라는 의견도 많습니다.

사실 자연어 인터페이스만을 통해서 기능들을 활용하는 것이 항상 편하지는 않을 것입니다. 기존에 미리 잘 정의되고 기획된 사용자 경험이 잘 녹아든 버튼 조작 하나만으로도 충분한 경우가 있기 때문이죠. 물론 언어 모델의 강점이 극대화되는 부분도 분명히 존재할 것입니다(사용자의 언어 context와 semantic을 이해하는 제품 경험).

결국에는 Rabbit R1이 제시하는 사용자 경험이 스마트폰에 녹아드는 형태로 시장에 자리 잡을 것이라는 의견들이 눈에 띄네요.

Self-service Analytics는 어떨까요? LLM은 분명히 IT/데이터 시장 전반을 뒤흔드는 혁신인 것이 사실이지만, 기존의 데이터 분석의 모든 방법론과 프로세스를 모두 대체할 수는 없을 것입니다.

데이터가 형성된 뒷배경(Data Generating Process)이라든지, 직접 세심히 정의해야 하는 비즈니스 로직/KPI이라든지, 비즈니스의 맥락을 고려하여 차트와 분석 결과를 '해석'하는 부분은 여전히 human-touch가 필요한 영역입니다.

결국에는 앞으로도 Self-service Analytics 제품의 기존 기능을 잘 접근하고 사용할 수 있도록 '돕는' 사용성 증진 측면에서 LLM이 활용될 가능성이 높아 보입니다.

#2. 할루시네이션 잡기

LLM의 상용화에서 가장 큰 문제로 꼽히는 문제 중 하나가 바로 할루시네이션(Hallucination)이죠.

💡
할루시네이션이란?
인공지능(AI)이 정보를 처리하는 과정에서 발생하는 오류

정확하지 않은 답변임에도 불구하고 굉장히 확신에 가득 찬(?) 어조로 말하는 LLM은 정확성과 신뢰성 측면에서 좋지 않은 인상을 남길 수 밖에 없습니다. 특히나 정확하고 신뢰할 만한 숫자를 요구하는 데이터 분석 분야는 더더욱 그럴 수 밖에 없죠.

23년 여름에 있었던 해프닝을 기억하시나요? 마이크로소프트는 '패브릭(Fabric)'이라고 명명된 데이터 분석 플랫폼을 현란한 데모와 함께 세상에 선보이며, "AI로 꼭꼭 숨어있던 Insight를 발견하세요," "손까락만 까딱하면 AI의 힘을 온몸으로 느끼실 수 있습니다.”라는 구호를 주창하였습니다.

하지만, 정작 사람들이 가장 큰 관심을 가졌던 자연어로 데이터에 질문할 수 있게 해주는 데모 영상에서 사용자의 질문에 대해 LLM이 부정확한 SQL 문을 생성했던 사건을 단순한 해프닝으로 넘길 수는 없겠죠.

OpenAI에서 올해 공개한다고 하는 GPT-5가 나오면 할루시네이션 현상이 줄어들 것이라고 예측된다고 하지만, Self-service Analytics 기업들 입장에서는 OpenAI에 대한 의존도가 극대화되는 현상은 가급적 피하고 싶을 것입니다.

#3. Private LLM, 파인 튜닝, 그리고 RAG

할루시네이션 문제, 그리고 거대 테크 기업(OpenAI 등의 Public LLM)에 대한 의존도를 줄이기 위해, Self-service Analytics 시장에서도 Private LLM의 가치가 갈수록 높아질 것으로 보입니다.

💡
Private LLM이란?
보통 오픈 소스로 공개된 LLM을 기업이 자신의 목적에 맞게 수정하고 보완한 모델을 의미

기업의 내부 데이터를 활용하여 모델을 수정하는 파인 튜닝 기법(비쌈), 모델을 수정하는 대신 답변을 생성할 때 다른 텍스트 데이터를 '참조'하여 답변 생성에 활용하는 RAG(Retrieval-Augmented Generation) 기법 등이 Private LLM의 핵심입니다.

이러한 작업들을 통해, 1) 할루시네이션 문제를 상쇄하고 2) 거대 테크 기업에 대한 의존도를 줄이고 3) 비용을 절감하는 효과를 얻을 수 있죠. Microsoft와 같은 초거대 테크 기업이 아니라면 직접 모델을 만드는 천문학적 비용(몇천억 단위)을 지불할 수 없고, 국내 대기업/금융권은 보안 이슈에 굉장히 민감해서, 사내에서 ChatGPT 등의 사용을 금지하고 있기도 하죠.  

결국에는 Private LLM이 Self-service Analytics/Self-service BI 시장에서도 강세를 보일 것이라고 예상됩니다.

나가며:  HEARTCOUNT는 LLM을 어떻게 활용하고 있는가

LLM으로 한 껏 달구어진 Self-service Analytics 시장에 대해 지금까지 함께 살펴보았습니다! 올 한 해도 생성형 AI의 진전은 산업 전반에 걸쳐 멈추지 않고 지속될 것 같은데요. Self-service Analytics 시장에도 어떠한 발전과 변화가 있을지 기대가 됩니다.

HEARTCOUNT 또한 LLM의 가능성과 한계점을 면밀히 살피고, HEARTCOUNT를 사용자 분들께서 더 편리하고 더 정확하게 사용하실 수 있도록 LLM과 관련된 여러 가지 연구 개발과 상용화 작업을 진행하고 있는데요.

작년에는 데이터와 관련된 질문-답변 자동화를 위한 일련의 기능의 일환으로 자연어를 SQL로 바꾸어주는 TTS(Text-to-SQL)와 대화형 분석 기능(Dialogue)을 세상에 선보이며 시대의 부름에 답하려 하였습니다(관련하여 올 초에 공유드린 글을 한 번 참고해보시면 좋을 것 같아요!).

올 한 해도 저희가 여러분께 보여 드릴 데이터 분석의 비전(Everyone is an Analyst)에 동참해주시고, 많은 기대 부탁드립니다:)

HEARTCOUNT with LLM 예시1. 주어진 차트의 핵심 인사이트 제공 및 관련 질문을 제안하는 대화형 분석 기능 Dialogue
HEARTCOUNT with LLM 예시2. 자연어를 SQL로 바꾸어주는 TTS(Text-to-SQL) 기능
💖
HEARTCOUNT는 모든 실무자들을 위한 시각화 및 분석 도구입니다.
지금 구글 계정으로 로그인하여 사용해보세요.