ChatGPT PR

ChatGPTのデータ分析機能(Advanced Data Analysis)の使い方

記事内に商品プロモーションを含む場合があります

ChatGPTには便利なデータ分析機能「Advanced Data Analysis(アドバンストデータアナリシス)」(旧:Code Interpreter)が備わっています。この機能を用いれば、データ分析初心者でも中級程度のデータ分析が可能になります。

ChatGPTのAdvanced Data Analysisって何?どんなことができるの?
ChatGPTの分析機能の使い方が知りたい
ChatGPTの分析機能の活用方法は?

この記事を読むことで、上記のような疑問やニーズが解決します。

通常大規模なデータの分析には、Pythonなどのプログラミング言語やBIツール(Business Intelligenceツール)が用いられます。どちらも高度な知見が必要になり、初心者にはハードルが高いでしょう。しかし、ChatGPTを活用することで、基本的なデータ分析が可能になります。

こんにちは、シントビ管理人のなかむーです。

ChatGPTの分析機能を用いれば、データから洞察を得たりすることもできます。上級者の方でも、洞察取得の第一歩目として有用でしょう。

今回も文系目線でわかりやすく解説していきます。

この記事を読むことで以下のことがわかります。

ChatGPTでデータ分析を行いたい方は、ぜひ参考にしてください。

ChatGPTでデータ分析を始める前に知っておくべき基本

ChatGPTを使ってデータ分析を始めることは、これまで専門的なスキルが必要だったデータ活用へのハードルを大きく下げてくれます。しかし、その能力と限界を正しく理解しておくことが、効果的な活用への第一歩です。

ChatGPTはどこまで「分析ツール」になれるのか?

ChatGPTは、アップロードされたデータの内容を理解し、指示に基づいて集計、グラフ化、傾向の読み取りなどを行うことができます。特に、自然言語で指示するだけで、複雑な操作なしに分析結果を得られる手軽さが最大の魅力です。

ただし、ChatGPTは万能な分析ツールではありません。高度な統計モデルを用いた専門的な分析や、非常に大規模なデータのリアルタイム処理などには限界があります。

ChatGPTは、「データ分析の優秀なアシスタント」と捉え、データのクレンジング(データの品質を向上させること)や、簡単な可視化、レポート作成のサポート役として活用するのが現時点では現実的でしょう。

Deep Researchのようなエージェント機能が発達していますので、近い将来、データアナリストレベルの分析もできるようになるかもしれませんね。

必要な準備:扱えるファイル形式とサイズの目安

ChatGPTでデータ分析を行うには、まず分析したいデータをChatGPTにアップロードする必要があります。

扱える主なファイル形式

データ分析のために、ChatGPTにアップロードできる代表的なファイルは以下のようなファイルです。

  • CSV (.csv)
  • Excel (.xlsx, .xls)
  • JSON (.json)
  • テキストファイル (.txt)
  • PDF (.pdf)

サイズの目安

サイズの目安は、1ファイルあたり512MBです。CSVファイルまたはスプレッドシートの場合には、ファイルサイズは約50MBです。

サイズが大きい場合は、データを分割したり、サンプリング(一部を抽出)したりする工夫が必要になることがあります。

Advanced Data Analysisの使い方5ステップ

ここからは、ChatGPTのデータ分析機能「Advanced Data Analysis」を実際に使用して、データ分析を行う流れを5つのステップで解説します。専門知識は不要ですので、一緒に気軽に試してみましょう。

今回はChatGPTで作成した以下の従業員満足度のサンプルデータを用います。以下のプロンプトを参考に、あなたもサンプルデータを作ってみてください。

統計データの分析用データサンプルを作成してください。テーマは従業員満足度調査です。120くらいのデータサンプルを作成してください。形式はcsvで出力してください。

ステップ1:データファイルをアップロードする方法

まず、分析したいデータファイル(例:CSVファイルやExcelファイル)をChatGPTにアップロードします。

  1. ChatGPTのチャット画面を開きます。
  2. 入力ボックスの左側にあるプラスマークのアイコンをクリックします。
  3. ドライブからの追加、またはコンピューターからの追加を選択し、ファイル選択画面で、分析したいファイルを選んでアップロードします。
  4. アップロードが完了すると、ファイル名が入力ボックス付近に表示されます。

これで、ChatGPTがデータを読み込む準備が整いました。

ステップ2:データ分析のプロンプトを入力

次に、アップロードしたデータを使って何をしたいのかをChatGPTに伝えます。この指示(プロンプト)が分析の精度を左右する重要なポイントです。具体的で分かりやすい言葉で伝えましょう。

  • 基本的なプロンプト例
    • 「アップロードしたデータについて説明してください。」
    • 「このデータの概要を教えてください。」
    • 「このデータから何がわかりますか。」
  • 具体的な分析を依頼するプロンプト例
    • 「売上データの月別推移を折れ線グラフで表示してください。」
    • 「顧客リストの年齢層別分布を円グラフで作成してください。」
    • 「アンケート結果の満足度スコアの平均値を計算してください。」
    • 「商品Aと商品Bの売上を比較してください。」
ポイント
  • 「何を使って(どの列のデータか)」「何をしてほしいか(集計、グラフ化など)」「どのように(グラフの種類など)」を明確に伝えましょう。
  • 一度で完璧な指示を出そうとせず、対話しながら分析を深めていくのがコツです。

今回はシンプルに、以下のようなプロンプトを入力しました。

従業員満足度のcsvデータを元に課題をピックアップしてください。その課題の根拠をグラフなどで示してください。

ステップ3:眺めながら待機

有料版のChatGPTで高度なデータ分析機能(Advanced Data Analysisなど)を利用している場合、ChatGPTは指示に基づいてPythonなどのプログラムコードを自動で生成し、実行します。特に指示をする必要はありません。

処理にはデータの量や分析内容によって数秒から数分かかることがありますので、結果が表示されるまで待ちましょう。

ステップ4:出力されたグラフや表を確認

ChatGPTが分析結果としてグラフや表を生成したら、その内容をしっかり確認しましょう。

  • グラフの場合
    • タイトル: 何のグラフか一目でわかりますか?
    • 軸ラベル: 横軸と縦軸が何を表しているか明確ですか? 単位は正しいですか?
    • 凡例: 色や線の種類が何を示しているか分かりますか?
    • 傾向: データは上昇傾向ですか?下降傾向ですか?特定のパターンはありますか?
    • 外れ値: 他のデータから大きく外れた値はありませんか?それは何を意味するでしょうか?
  • 表の場合
    • 見出し: 各列・各行が何を表しているか明確ですか?
    • 数値の単位: 金額、個数、割合など、単位は正しいですか?
    • 集計結果: 合計値、平均値、最大値、最小値などが目的に合っていますか?

もしグラフが見づらかったり、情報が不足していたりする場合は、「グラフの縦軸の範囲を変更して」「各項目に数値を表示して」のように追加で指示を出して改善できます。データ分析の洞察を得る素材が得られるまで、繰り返しましょう。

なお、サンプルデータに対する分析の回答とグラフは以下の通りです。

ChatGPTの回答

🔍 課題:開発部の満足度が特に低い

  • 根拠:
    • 開発部の総合満足度は、中央値・下限ともに他の部署よりも明らかに低くなっています。
    • 外れ値が少なく、多くの従業員が低い満足度スコア(2以下)に集中していることも問題の深刻さを示しています。
※一部フォントの関係でテキストが表示されていません。

ステップ5:洞察を得て次のアクションに活用

分析結果(グラフや表)を眺めるだけでは終わりません。そこから何が言えるのか(洞察)を考え、次の行動(アクション)に繋げることがデータ分析の最終目的です。

  • ChatGPTに手伝ってもらう
    • 「このグラフから何が読み取れますか?」
    • 「この結果の要点を3つにまとめてください。」
    • 「この分析結果から、どのような改善策が考えられますか?」
  • 自分で考えるポイント
    • 当初の分析目的は達成できましたか?
    • 何か新しい発見はありましたか?
    • この結果を誰に伝え、どのように活用できそうですか?

ChatGPTとの対話を通じて得られた洞察を基に、具体的な次のステップを検討しましょう。

ChatGPTに手伝ってもらう場合、推論能力の高いo3の使用がオススメです。

初心者向け|まず試してみよう定番分析3選

データ分析のイメージを掴むために、ここでは初心者でも簡単に試せる代表的な分析例を3つ紹介します。お手持ちのデータでぜひ実践してみてください。

売上データの月別推移をグラフ化

企業の売上データなど、時系列で記録された数値の推移を見るのは基本的な分析の一つです。これにより、季節ごとの変動や成長トレンドなどを把握できます。

  • 準備するデータ例
    「日付」列と「売上額」列を含むCSVファイルやExcelファイル。
  • プロンプト例
    • 「アップロードした売上データを使って、月別の売上合計額を計算し、折れ線グラフで表示してください。」
    • 「X軸を月、Y軸を売上合計として、2023年の月別売上推移を棒グラフで示してください。」
  • 確認するポイント
    売上が伸びている時期、落ち込んでいる時期はいつか。特定のイベントとの関連はあるか。前年同月比はどうなっているか。

顧客リストの年代・地域別分布を可視化

顧客データや会員リストなどから、どのような属性の人が多いのかを把握することは、マーケティング戦略などを考える上で重要です。

  • 準備するデータ例
    「年代」列(例:20代、30代)や「居住地域」列(例:東京都、大阪府)を含む顧客リスト。
  • プロンプト例
    • 「顧客リストの年代別人数を円グラフで表示してください。」
    • 「都道府県別の顧客数を棒グラフで示し、多い順に並べてください。」
    • 「年代と性別のクロス集計表を作成してください。」
  • 確認するポイント
    どの年代層が中心顧客か。特定の地域に偏りはあるか。ターゲット層と実際の顧客層にずれはないか。

アンケート自由回答のキーワード抽出

アンケートの自由記述コメントや、製品レビューなど、テキストデータから顧客の声の傾向を掴むこともChatGPTは得意です。

  • 準備するデータ例
    「自由回答」列を含むアンケート結果ファイル。
  • プロンプト例
    • 「アンケートの自由回答欄から、よく使われているキーワードを10個抽出してください。」
    • 「ポジティブな意見とネガティブな意見に分類し、それぞれの代表的なキーワードを教えてください。」
    • 「これらの意見を要約してください。」
  • 確認するポイント
    どのような言葉が多く出現しているか。顧客が何に関心を持っているか、何に不満を感じているかのヒントになるか。

他にも自身が取り組んでいる業務や興味がある事柄のデータをChatGPTに分析させてみましょう。実際に使用することで、使い方に慣れていきます。

ChatGPTのデータ分析機能を使う上での注意点

ChatGPTは便利なツールですが、データを取り扱う以上、セキュリティや限界について理解しておくことが重要です。

機密情報をアップロードする前のマスキング方法

個人情報(氏名、住所、電話番号、メールアドレスなど)や、企業の内部情報、顧客のプライベートな情報など、機密性の高いデータをChatGPTにアップロードする際は、細心の注意が必要です。

  • 原則
    機密情報はアップロードしない。
  • どうしても必要な場合
    • マスキング
      個人名や具体的な数値などを「Aさん」「商品X」のように一般的な表現に置き換える。
    • 匿名化
      個人を特定できないようにデータを加工する。例えば、年齢を年代(20代、30代)に丸める、住所を都道府県のみにするなど。
    • ダミーデータ化
      元のデータの構造や傾向は維持しつつ、実際の値を架空の値に置き換えたサンプルデータを使用する。
    • データの最小化
      分析に本当に必要な項目・期間のデータだけに絞り込む。

ChatGPTの利用規約やプライバシーポリシーも確認し、組織のセキュリティポリシーに従って運用しましょう。

処理が重いデータの代替手段(サンプリングなど)

前述の通り、非常に大きなデータ(数GBを超えるようなもの)や複雑な処理は、ChatGPTの現行機能では対応が難しい場合があります。

その場合には代替手段を検討しましょう。

  • サンプリング
    全データの一部を無作為に抽出して分析します。全体の傾向を掴むための初期分析として有効です。「データ全体から1000行をランダムに抽出して、そのデータで分析してください」のように指示できます。
  • 集計済みデータの利用
    事前にデータベースや他のBI(Business Intelligence)ツールで集計した結果(例えば、日別のアクセス数を月別に集計したものなど)をChatGPTにアップロードして、可視化や解釈を依頼する。

ChatGPTだけでは難しい高度解析の見極め

ChatGPTはデータ分析の強力な入り口となりますが、すべての分析ニーズに応えられるわけではありません。

  • ChatGPTが得意なこと
    • データの概要把握、基本的な統計量の算出
    • 標準的なグラフ作成(棒グラフ、折れ線グラフ、円グラフ、散布図など)
    • データのフィルタリング、ソート
    • テキストデータの簡単なキーワード抽出や要約
  • 専門ツールや専門知識が必要な可能性が高いこと
    • 複雑な統計モデリング(重回帰分析、因子分析、クラスター分析など)
    • 機械学習モデルの構築とチューニング
    • 非常に大規模なデータセットの処理、リアルタイム分析
    • 特定の業界・分野に特化した高度な分析手法

ChatGPTで初期分析を行い、仮説を立てた上で、より深い分析が必要だと判断した場合は、RやPythonといったプログラミング言語、SPSSやSASのような統計解析ソフトウェア、TableauやPower BIのようなBIツールの利用や、データサイエンティストなどの専門家への相談を検討しましょう。

生成AIスキルを高めたい方はスクールもおすすめ!

生成AIを使いこなして、「スキルアップしたい」「転職したい」「副業したい」という方は生成AIのスクール受講がオススメです。

実践的な内容が学べたり、転職支援が受けられたりと、独学で学ぶよりも効率的です。興味がある方は以下の記事を参考にしてください。

ChatGPTをデータ分析に活用しよう!

この記事では、ChatGPTを使ってデータ分析を始めるための基礎知識、具体的なステップ、定番の分析例、そして注意点について解説しました。

ChatGPTのデータ分析機能は、誰でも気軽に、自然言語でデータと対話できる画期的なものです。これまでデータ分析に苦手意識を持っていた方でも、その第一歩を踏み出しやすくなったと言えるでしょう。

もちろん、万能ではありませんし、機密情報の取り扱いや機能の限界には注意が必要です。しかし、これらを理解した上で活用すれば、日々の業務におけるデータに基づいた意思決定や、新しい発見の手助けとなる強力なツールになります。

まずは簡単なデータから、ChatGPTとのデータ分析を始めてみてください。使っていく中で、より効果的なプロンプトのコツや、ChatGPTの得意なこと・苦手なことが見えてくるはずです。

最後までお読みいただき、ありがとうございました!!

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA