1.LLM(巨大言語モデル)および生成型AIがデータ産業でどのように使われるのか最新動向を知りたい方。
2.実務者がデータ専門家の助けを借りずに自分で分析できるSelf-service Analytics/BIツールに興味のある方。
3.代表的なSelf-Service AnalyticsプレーヤーであるTableau、PowerBI、HEARTCOUNTなどがLLMをどのように製品に商用化しているか知りたい方。
はじめ:データの民主化とSelf-service Analytics
企業のデータリテラシーとデータ活用レベルを向上させるために、Self-service Analytics/BIの必要性は日々高まっています。
ユーザーがIT部門の助けを借りずに直接データを活用してチャートを描き、洞察を導き出し、変化をモニタリングするBIのコンセプト。
企業で生産され蓄積される多数のデータが少数のデータ担当者によってのみ消費される現象を防ぎ、組織の全員がデータから価値を創出するデータ民主化のために、多くの企業がSelf-service Analytics/BIを導入しています。
2023年は、特に巨大な言語モデルの商用化とともに、Self-service Analytics市場のプレイヤーにも多くの変化がありました。 どのようなことがあったのか、そして24年にはどのような変化が期待されるのか、一緒に見ていきましょう!
Self-service Analytics市場全般
成長するSelf-service Analytics市場
データ市場が日に日に成長するにつれて、Self-service Analytics、Self-service BI市場も一緒に成長していくようです。Fortune Business Insightsのリサーチ結果によると、2022年基準でSelf-service Analytics / BI市場の規模は、約48.8億ドル水準であり、2030年までに200億ドル規模の市場を形成すると予測されているそうです。 また、ガートナーによると、2024年までに企業の75%がSelf-service Analytics / BIを導入するとしますね。
Self-service Analytics キープレーヤー
Self-service Analytics市場の最もコアなプレーヤーはPower BIとTableauです。TrustRadiusが21年に発表した資料によると、Power BIとTableauはそれぞれ36%、20%で合わせて半分以上の市場シェアを占めているそうです。
また、ガートナーは昨年5月23日に<Magic Quadrant for Analytics and Business Intelligence Platforms>というリサーチを、フォレスターは昨年6月13日に<The Forrester Wave™: Augmented Business Intelligence Platforms, Q2 2023>というリサーチを通じ、市場の中核製品をそれぞれの基準で分類しました。
ガートナーはMagic Quadrantという一象限で市場の製品を分類しました。 市場のリーダーには、Microsoft(Power BI)、Salesforce(Tableau)、Qlik(Qlik View、Qlik Sense)が位置していますね。 加えて、Augmented Analytics(拡張分析、人工知能および機械学習技術などを活用して、ユーザーの分析能力を増強するコンセプト/哲学を意味する)市場のリーダーであるThoughtspotとSisense、既存の市場での地位を固めているOracle、IBM、SAP、SASなどがVisionaries(「差別化されたビジョン」を持つ製品)を占めています。Challengers(市場で地位を確立しているが、Use case/Applicationが制限されている製品)にはGoogle Looker、MSTR、AWSなどがありますね。
市場コア推移
LLMの登場とBI + Augmented Analyticsの登場
2023年データ産業/市場の最もホットな話題は何と言っても大型言語モデル(Large Language Model, LLM)です。OpenAIのChatGPTとGPT 3.5が商用化のスタートラインを切り、その後、巨大テック企業が続々と自分たちのモデルを発表しました。 また、Huggingfaceなどを通じたOpen Source LLMの普及により、各企業はそれぞれのビジネスにLLMを導入するために拍車をかけています。
Self-service Analytics市場も例外ではありません。 主要なプレーヤーは、LLMを自社の製品に組み込むことを躊躇なく行っています。このような現象により、市場で発生した最も大きな変化は、Self-service Analytics製品とAugmented Analytics製品の境界が徐々に曖昧になっていることです。 既存のSelf-service Analyticsを標榜していた製品はほとんどBIの性格を持っていましたが、LLMの登場により、ユーザーが既存に開発された機能に自然言語に基づいて簡単にアクセスし、また活用することができるようになりました。 キープレーヤーのいくつかの事例を見てみましょう。
Tableau: Tableau GPT & Tableau Signal
Tableauは、Salesforceの他の製品であるEinstein Discoveryに既存開発されていたEinstein GPTをTableauと組み合わせました。まだ商用公開されていないので実体を確認することはできませんが、核心的な機能として掲げているのは
1.データ操作/準備ソリューションであるTableau Prepで自然語で入力した要件をSQL化する機能
2.指標の核心的な変化を自動的に把握して自然語で解釈する機能(Pulse)
3.自然語で入力した分析質問に対する適切な視覚化と解釈を提供する機能(Pulse Q&A)
があります。現在はクローズドベータ版で、2月14日からベータ版をクラウドの顧客に無償提供するそうです。
PowerBI: Copilot
MSはすでに自社の様々な製品にCopilot(GPT-4ベース)を結合したことがあります。 Power BIもその一つになりましたが、PowerBI Copilotが提供する機能の範囲もTableauと似ています。ユーザーが自然語で「このようなダッシュボードを作りたい」と入力すると、それに合ったチャートを直接作ってダッシュボード化する機能、ダッシュボードで気になる内容を自然語で質問すると適切な解釈を導き出してくれる機能、文章で気になる内容を入力するとPowerBI独自のデータ分析言語であるDAX(Data Analysis Expression)に変換してくれる機能などがあります。
その他の製品
Thoughtspot: Thoughtspotは、LLMが登場する以前からNLP(Natural Language Processing、自然言語処理)をベースにした拡張型分析市場のリーダーです。 LLMの登場に伴い、ThoughtspotもGPT-3を組み合わせたSageをリリースしました。 ユーザーの自然言語の質問に対する適切な視覚化と自然言語の要約機能を提供します。
Microstrategy: MicrostrategyもLLMを組み合わせたMicrostategy AIを昨年10月に世の中に公開しました。LLMベースの自動分析の提供、自動ダッシュボード形成、自動SQL生成などの機能を提供するそうです。
Qlik Sense: Self-service Analytics界のもう一つのリーダーであるQlik SenseもLLMを組み合わせたInsight Advisorをリリースしました。 ユーザーが入力した自然言語の質問に対する可視化と説明を提示し、結果物をMS Chatを通じて組織の他のメンバーと共有することができます。
激しいLLM戦争の中で少し息抜き
ここまで見てきたように、巨大な言語モデルの影響力はSelf-service Analytics市場全体を揺るがしています。市場のすべてのプレーヤーがLLMを導入し、競争しているのを見ると、生成型AIがますます「標準」になりつつあるような気がします。 それにもかかわらず、この激しい競争の中でしばらく息を止めて、華やかで強力に見えるLLMの裏側を覗いてみる必要がありそうです。
#1. LLMが既存のすべてを置き換えることはできない。
ちょっと横道にそれてしまいましたが、約2週間前、Rabbitが新製品のデモ映像を公開しました。 映像を公開してから10日間でなんと460万回以上の再生回数を記録し、市場の注目を浴びています。 この製品は、生成型AI技術を最大限に活用し、既存のスマートフォンに代わるという野心的なビジョンを提示しています。
市場の反応も様々です。製品が見せる驚くべき性能(画像認識、音声認識、LLM)と未来志向的なUXは確かに目を見張るものがありますが、果たして既存のスマートフォンに取って代わることができるのか懐疑的な意見も多いです。
実際、自然言語インターフェースだけで機能を活用することが常に快適とは限りません。 既存のユーザーエクスペリエンスがあらかじめよく定義され、企画されたユーザーエクスペリエンスがよく溶け込んだボタン操作だけでも十分な場合があるからです。 もちろん、言語モデルの強みが最大化される部分も明らかに存在するでしょう(ユーザーの言語コンテキストとセマンティックを理解する製品エクスペリエンス)。
最終的にはRabbit R1が提示するユーザーエクスペリエンスがスマートフォンに溶け込む形で市場に定着するだろうという意見が目立ちます。
Self-service Analyticsはどうでしょうか?LLMは明らかにIT/データ市場全体を揺るがすイノベーションであることは事実ですが、従来のデータ分析のすべての方法論とプロセスをすべて置き換えることはできないでしょう。
データが形成された背景(Data Generating Process)とか、自分で細かく定義しなければならないビジネスロジック/KPIとか、ビジネスの文脈を考慮してチャートと分析結果を「解釈」する部分は、まだhuman-touchが必要な領域です。
最終的には、今後もSelf-service Analytics製品の既存の機能にうまくアクセスして使用できるように「支援する」ユーザビリティ向上の面でLLMが活用される可能性が高そうです。
#2. ハルシネーションをつかむ
LLMの商用化で最も大きな問題として挙げられるのが、幻覚(Hallucination)です。
人工知能(AI)が情報を処理する過程で発生するエラー。
正確でない回答であるにもかかわらず、非常に確信に満ちた(?)口調で話すLLMは、正確性と信頼性の面で良くない印象を残すしかありません。 特に、正確で信頼できる数字を要求するデータ分析の分野ではなおさらそうです。
23年の夏に起きたハプニングを覚えていますか?マイクロソフトは「ファブリック(Fabric)」と名付けられたデータ分析プラットフォームを派手なデモとともに世に送り出し、「AIで隠れていたInsightを発見してください」、「指先一つでAIの力を全身で感じることができます」というスローガンを掲げました。
しかし、実際のところ、人々が最も関心を持っていた自然言語でデータに質問できるようにするデモ映像で、ユーザーの質問に対してLLMが不正確なSQL文を生成した事件を単純なハプニングで済ませることはできないでしょう。
OpenAIが今年公開するというGPT-5が出れば、ハラスメント現象が減ると予測されていますが、Self-service Analytics企業にとっては、OpenAIへの依存度が最大化する現象はなるべく避けたいところです。
#3. Private LLM, ファインチューニング、そしてRAG
ハラスメント問題、そして巨大テック企業(OpenAIなどのPublic LLM)への依存を減らすために、Self-service Analytics市場でもPrivate LLMの価値はますます高まっていくと思われます。
通常、オープンソースで公開されたLLMを企業が自分の目的に合わせて修正・補完したモデルを意味する。
企業の内部データを活用してモデルを修正するファインチューニング技法(高価)、モデルを修正する代わりに回答を生成する際に他のテキストデータを「参照」して回答生成に活用するRAG(Retrieval-Augmented Generation)技法などがPrivate LLMの核心です。
このような作業を通じて、1)ハルシネーションの問題を相殺し、2)巨大テック企業への依存を減らし、3)コストを削減する効果を得ることができます。 Microsoftのような超巨大テック企業でなければ、直接モデルを作る天文学的な費用(数千億単位)を支払うことができず、国内の大企業/金融機関はセキュリティー問題に非常に敏感であるため、社内でChatGPTなどの使用を禁止していることもあります。
最終的にはPrivate LLMがSelf-service Analytics/Self-service BI市場でも強さを発揮すると予想されます。
あとがき: HEARTCOUNTはLLMをどのように活用しているのか?
LLMで一段と熱くなったSelf-service Analytics市場について、これまで一緒に見てきました!今年も生成AIの進歩は、産業全般にわたって止まることなく続くようです。 Self-service Analytics市場にもどのような発展と変化があるのか楽しみです。
HEARTCOUNTもLLMの可能性と限界点を精査し、HEARTCOUNTをユーザーがより便利で正確に使用できるように、LLMに関する様々な研究開発と商用化作業を進めています。
昨年は、データに関する質問・回答自動化のための一連の機能の一環として、自然言語をSQLに変換するTTS(Text-to-SQL)と対話型分析機能(Dialogue)を世に送り出し、時代の要請に応えようとしました(関連で今年初めに共有した記事を一度参考にしていただければと思います!)。
今年一年、私たちが皆さんにお見せするデータ分析のビジョンである、Everyone is an Analystにご期待ください!)