Advanced Data Analysis
読み: アドバンスド データ アナリシス
高度データ分析とは自然言語で集計
Advanced Data Analysisは、ChatGPTに搭載されたデータ分析機能である。旧称はCode Interpreterで、2023年7月に一般公開された後、2023年10月に現在の名称に変更された。チャット上でPythonコードを実行し、CSVの集計、グラフ作成、ファイル変換などを自然言語の指示だけで行える。
かんたんに言うと
ChatGPTの中にExcelとPythonが合体したような機能が入っている。「この売上データの月別推移をグラフにして」と頼むだけで、裏側でPythonが動いてグラフを生成し、ダウンロード可能なファイルとして返してくれる。
Code Interpreterから進化したAdvanced Data Analysisの経緯と機能
もともとこの機能は2023年3月にChatGPT Plusのベータ機能として「Code Interpreter」の名前で登場した。名前の通り、Pythonコードを解釈して実行するサンドボックス環境である。
ところがCode Interpreterという名前は、プログラマー以外にとっては馴染みがなかった。OpenAIはより広いユーザー層にリーチする狙いで、2023年10月にAdvanced Data Analysisへ改称した。
名前は変わっても中身はほぼ同じである。ChatGPTの会話ウィンドウにファイルをドラッグすると、裏側のPython環境がそのファイルを読み込み、ユーザーの指示に従って処理を実行する。実行結果はテキスト、表、グラフ、ファイルのいずれかの形式で返される。
具体的にできること
最も使われているのはCSVやExcelファイルの分析である。数万行のデータを渡して「上位10カテゴリの売上構成比を円グラフにして」と指示すれば、pandasとmatplotlibで処理されたグラフが返ってくる。
画像の加工にも対応している。写真のリサイズ、フォーマット変換、背景の除去といった処理をPythonのPillowライブラリで実行する。PDFからのテキスト抽出や、複数ファイルの一括処理も可能である。
数学的な計算も得意分野で、統計検定、回帰分析、最適化問題をSymPyやSciPyで解く。レポート用のグラフを体裁まで整えて出力するため、分析結果をそのまま資料に貼り付けられる。
ただし、インターネットへのアクセスはできない。外部APIを叩いてリアルタイムデータを取得するような用途には使えないのが制約となる。
ビジネスでの活用と現場の実態
マーケティング部門での利用が目立つ。Google Analyticsからエクスポートしたデータを投げ込んで、ページ別のコンバージョン率を集計させるといった使い方は、Excelのピボットテーブルに苦戦していた層に響いた。
経理部門では、請求書PDFから金額を抜き出して一覧表を作る用途で使われている。人事部門のアンケート集計、営業部門の受注データ分析と、部門を問わず「ちょっとしたデータ処理」の受け皿になっている。
一方で、現場から聞こえてくる不満もある。処理が途中でタイムアウトする、大きなファイルをアップロードできない、実行環境がセッションごとにリセットされるため前回の続きができない。業務の本格的な分析基盤としてはまだ物足りない面がある。あくまで「探索的な分析」や「とりあえずの可視化」に向いているツールだと割り切るのが現実的な使い方になる。
専用ツールとの使い分け
Advanced Data Analysisは便利だが、TableauやPythonのJupyter Notebookを置き換えるものではない。
Tableauはダッシュボードの共有やリアルタイム接続に強い。チーム全体で同じデータを見ながら議論する場面では、ChatGPT上で個人が生成したグラフでは対応できない。Jupyter Notebookは処理の再現性と履歴管理に優れており、分析コードをバージョン管理してチームで共有する運用には不可欠である。
Advanced Data Analysisの強みは「コードを書けない人でもデータ分析に着手できる」点に集約される。分析の入口のハードルを下げた功績は大きい。とはいえ、そこから先のスケーラビリティやガバナンスを考えると、専用ツールへの移行は避けられない。「まずAdvanced Data Analysisで仮説を立て、本格分析は専用環境で」という二段構えが実務上の落としどころになる。
当社の見解
データパイプラインは「動けばいい」で作ると、3か月後に保守不能になる。当社のAI記憶システムは18ステップの夜間統合パイプラインを毎日自動実行している。最も痛い教訓は、データとデザインを分離しなかったことで起きた事故だ。1,500ページのコンテンツを一括更新した際、データとHTMLが混在していたために全ページが壊れた。以降、データはデータベースに、デザインはテンプレートに分離する設計に切り替えた。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
