2017年11月中旬に「Qlik Sense November2017」がリリースされていました。さっそくダウンロードしてみました。
Qlik Sense June2017あたりからデータマネージャというデータ準備機能が充実してきているようです。クロス集計データのロードや複数テーブルの縦結合(マージ?)などもGUI操作で実現できました。ロードスクリプトが書けない私にとっては大変便利で助かる機能です。
■やってみたこと
政府統計局で公開されている「都道府県別 身長・体重の平均値及び標準偏差」をダウンロードしてQlik Senseにロードしました。
■対象データ
以下のURLからダウンロードしました。
⇒このページで「都道府県別 身長・体重の平均値及び標準偏差」Excelをダウンロードしました。
※こんなデータです。
他統計局の例に漏れず、データ形式ではなくてクロス集計表です・・・。(>_<)
しかも、ご丁寧なことにシートが各年齢ごとに分かれています。。。
※手っ取り早く動画でも確認できるようしました。
では、以下はやってみた手順です。
Qlik Sense Desktopを起動して新規アプリを作成し、画面指示に沿ってデータ追加を行います。
下記の画面は、C:\TEMPに保存したダウンロードデータを選択しているところです。
ファイルを選択すると、プレビューを表示してくれます。
画面左側はシート名です。まずは「5歳」シートからやってみました。
見事にクロス集計表なので、地道に取り込むことを覚悟して、ここで不要な列項目は削除しました。
思いきって、[B列:都道府県]、 [C列:男 平均身長]、 [G列:女 平均身長] のみにしました。
さらに不要な上部のヘッダ行も削除します!
「ヘッダーサイズ」を「 6 」にしました。
ロードする項目を選択したら「データの追加」ボタンをクリックします。
データマネージャが表示されました!
取り込んだテーブル(丸バブル)をクリックすると画面下部にデータプレビューが現れます。
最下部の編集アイコンをクリックしましょう!!
下記のデータ準備画面にていろいろ編集を行います。
まずは項目名を変更しました。「都道府県」「男_5歳」「女_5歳」
(※)項目名を「性別_年齢」にしておいてください。
そして、「ピボット解除」ボタンをクリックします!!
その状態でピボット解除したい「男_5歳」と「女_5歳」列を選択します。
すると、画面下部のプレビューが見事にテーブル形式の扱いやすそうなデータになっています。
これが確認できたら「ピボット解除を適用」をクリックしましょう!
テーブル形式に変換されたデータをさらに加工してまいります。
このあたりもQlik Senseの新しいデータ準備機能みたいですね。
加工したい項目を選択すると、画面下部にデータ属性や値の分布、また置換や分割などの加工ウィンドウが表示されます。
今回は先ほど「性別_年齢」で設定して生成された値を、"_" にて分割いたします。
項目を選択します。
「分割」を選択すると区切り文字候補をハイライトしてくれています。
今回はそのまま「項目の作成」で確定いたしました。
あっという間に、各都道府県の5歳男女別の平均身長データになりました!!
項目名をそれぞれ変更して完成です。
データができたらそのまま「データのロード」ボタンでデータロードして完了です。
帳票形式の面倒なクロス集計表をGUIの操作だけでここまで出来るとはなかなかのモノだと思いました。
次回はさらに、他の年齢のシートも追加して統合していきたいと思います。
以上