ChatGPTでテストデータを簡単に作成する方法
更新日:7月20日
データ分析のイメージを掴むときにはテストデータが役に立ちます。ChatGPTとQlik Senseで素早く効果的なテストデータを作ったときの情報です。
※2024年7月時点の環境を利用しています
<全体手順の概要>
⇒ 作業1に戻ってイイ感じのデータになるまで試行錯誤する
■ChatGPTに指示をしてみる
ChatGPTに接続して下記のように指示をしてみました。
Qlik Senseで分析するサンプルデータを作成してください。
小学生の成績を想定したデータです。
児童数は10000名、小学校数は25校、1年生から6年生まで
氏名、性別、学年と入学から現在までの共通テストの5教科分の結果をダミーで作成してください。
データはExcelで出力します。
ファイル名は小学生共通テスト
出力先は/content/drive/MyDrive/00.Data
Pythonでコーディングお願いします
※ 出力先は後述手順でマウントしたGoogleドライブフォルダのパスです
すると早々に回答とPhythonコードを返してくれました。
■GoogleコラボでPython実行してみる
① Googleコラボに接続する
② ノートブックを新規作成する
下記画像の[+ ノートブックを新規作成]を押すか、[ファイル]-[ドライブの新しいノートブック]メニューを選択します
③ Googleドライブフォルダをマウントする
Googleドライブフォルダのマウント 左メニューからフォルダアイコンを押します | Googleドライブフォルダのマウント [Googleドライブに接続]を押します |
※ Googleコラボでマウントした後、該当フォルダの三点メニューから[パスをコピー]できます。
④ ChatGPTで生成したPythonコードをコピーしてGoogleコラボで実行する
ChatGPTが生成したコードは右上の[コードをコピーする]でコピーできます。
コピーしたコードをGoogleコラボの画面で[+ コード]メニューを押してコーディングエリアに貼り付けます。実行アイコンもしくは[Ctrl+Enter]で実行できます。
⑤ 生成されたExcelファイルを確認します
Googleドライブ上にファイルを出力されています。三点メニューからダウンロードも可能です。
■作成したデータをQlik Sense SaaSで確認してみる
① Qlik SenseでGoogleドライブへの接続を作成する
Googleコラボから出力されるExcelファイルをリロードしたアプリを作っておけば、作成したテストデータの内容の確認も簡単です。
参考までに今回のChatGPT-Googleコラボ-Qlik Senseの試行錯誤の過程を載せておきます。
▼最初の出力データ 各教科が横持ちになっています。また時系列の指定を忘れたので1回のテスト結果のみとなりました。 | ⇒ 修正の指示
2018年から6年分のデータとして作成してください
|
▼修正データ その1 各教科に加えて年まで横持ちになってしまいました。 | ⇒ 修正の指示 テーブルの列は 氏名、学校、学年、性別、テスト年月、教科、点数 にしてください |
▼修正データ その2 縦持ちデータになり、しかも年3回のテスト実施にしてくれました。 データの基本レイアウトはできたので、ここでQlik Senseに読み込んで分析したところ、全員の点数が平均的で現実離れしていたのでここからデータの中身を修正していきます。 | ⇒ 修正の指示 各教科のテスト年月ごとの点数は40点から60点をピークにした正規分布にしてください |
▼修正データ その3 一発で正規分布なデータになり、教科や学年などによって分布も異なるイイ感じになりました。
|
これでイイ感じになったかと思いきや、、、
Qlik Senseで確認してみるといろいろと不備が見つかるので、まだまだChatGPTとの試行錯誤を続けてみます。
以上です
Comments