第6回:グラフの使い方入門~Qlikで学ぶデータ分析~
更新日:2023年6月23日
基本チャートを実践解説!
基本構造と目的に応じたグラフパターン
前回は、基本的なグラフとそれぞれに適した目的のパターンをお伝えしました。今回はそれぞれのグラフごとに、構造や使い方を見ていきたいと思います。
各種グラフの構造を見ていくにあたっては、これまでに確認してきた「メジャー」と「軸」に視点をおいて説明をしていきますのでそれぞれを思い出しながらじっくり読んでみて下さい。
■棒/折れ線/円グラフ( 1軸/1メジャー)
基本グラフの中でも特に一般にもなじみの深いのが、棒グラフ、折れ線グラフ、円グラフです。これらは、軸とメジャーをどのように構成するかによって、様々な目的で利用することができます。一番シンプルな構成が「1軸/1メジャー」のパターンです。単一のメジャー(売上金額 等)の推移や構成比を見たり、比較したり、ランキングを作成したりする際に使用することができます。
これらのビジュアライゼーションは分析対象となるメジャーが1つなので、組み合わせる軸によって分析の切り口が変わります。推移を見る場合には、年や月など時系列の順番を持った軸を組み合わせ、棒グラフか折れ線グラフを利用します。推移以外を見る場合は、モノ、場所、人など様々な軸を組み合わせることとなります。
また、上図を見ても分かるように、棒グラフは推移や比較、順序といった目的で利用するのに対して、折れ線グラフは原則的には推移を見る際に利用するのが一般的です。同様に円グラフは構成比を見るためのグラフとして利用するのが一般的です。
■棒/折れ線グラフ/コンボグラフ( 1軸/複数メジャー)
同じグラフを使用していても、1軸/1メジャーのグラフに別のメジャーを追加することで、複数メジャーを比較して情報を得ることができます。軸を時系列にすることで、複数メジャーの推移を比較することができますし、それ以外の軸を組み合わせると項目ごとに複数メジャーを並べて比較することができます。
下図のように売上と利益という2種類のメジャーを構成することで、容易に比較情報を得ることができます。棒グラフ、折れ線グラフを利用することで、各メジャーが複数の棒や折れ線でビジュアライゼーションされます。
■棒/折れ線グラフ(複数軸/1メジャー)
棒グラフ、折れ線グラフは、軸を複数にすることで、異なる軸を組み合わせた情報を得ることができます。一見すると「1軸/複数メジャー」のグラフのようにも見えますが、色分けされた複数の要素が、複数のメジャーではなく、1つのメジャーを複数軸で集計した値であることがポイントです。
下図で例えると「売上」に対して「製品」「支社」「年/期」といった複数の軸で分析していることが確認できます。
・各製品の支社別グラフ:軸(支社と製品)、メジャー(売上金額)
・製品別売上推移グラフ:軸(年/期と製品)、メジャー(売上金額)
補足)データの持ち方とチャートの構成
「1軸/複数メジャー」で構成するか「複数軸/1メジャー」で構成するかはデータの持ち方とも関係してきます。
上図の右から2つ目の折れ線チャートを例にすると、一般的なデータの持ち方としては[年月]、[製品名]、[売上]となり、[年月]と[製品名]を軸として扱うことができるため 「複数軸/1メジャー」の構成でチャートを表現することができます。
しかし、場合によっては[年月]、[製品Aの売上]、[製品Bの売上]、[製品Cの売上] というように、売上というメジャーが既に製品ごとに分けられた状態でデータになっていることがあります。
この場合は、データを一般的な持ち方に加工して「複数軸/1メジャー」で構成するか、そのまま「1軸/複数メジャー」で構成するかの状況判断が必要になります。
■コンボグラフ(1軸/複数メジャー)
また、比較する複数のメジャーの大きさや単位が異なる場合には、コンボグラフを利用することで単位や範囲の異なる目盛り軸を追加することができます。下図では売上(円)と達成率(%)を比較しており、達成率の目盛りを副軸として追加することで両メジャーをビジュアライゼーションしています。また、下段の比較パターンでは、通常は推移を表現するために使用する折れ線チャートから線を省略することで、比較が分かりやすくなっています。
■散布図(1軸/複数メジャー)
複数のメジャーを座標軸上に表示することで、メジャー同士の関係性を見ることができます。Qlik Senseでは、座標にプロットする点は軸として定義することができます。一般的にはメジャーの相関関係を把握する際に利用されますが、実際の業務の中では、下図のようにアクションにつながる軸の値(顧客や営業マン)を見つけ出すために使用されることもあります。
①相関関係のあるメジャーを使って異常を発見する例
この散布図では、X座標に[受注数]、Y座標に[出荷数]という2つのメジャーを表現しています。
軸としては[営業マン]をプロットしています。[受注数]が多ければ当然[出荷数]も多いはずという前提のもとで見てみると、[新川 誠]という営業マンだけ、[受注数]の割に[出荷数]が大幅に少ないことが分かります。
この情報から、[新川 誠]さんは何らかのトラブルで出荷が出来ていないのでは?とチェックするなどのアクションを起こすことができます。また、軸を[営業マン]ではなく、[顧客]や[製品]などにすれば、出荷が滞っている顧客や製品を発見することも容易に実現できます。
②相関関係の曖昧な分布から、特性ごとにカテゴリを把握する例
こちらの散布図では、X座標に[購入回数]、Y座標に[購入金額]という2つのメジャーを表現しています。
軸としては[顧客]をプロットしているので、散布図の右上にプロットされる顧客は「購入回数も多くて金額も多い顧客」ということが分かります。右下あたりにプロットされる顧客は「購入回数は多いが金額は少ない顧客」ということが分かります。
この情報から、顧客を特性ごとに分類し、それぞれに応じた営業戦略を検討するといったアクションに繋げることができます。
補足)Qlik Senseにおける散布図のコツ
ツールによっては、X軸、Y軸の2項目のデータのみで散布図を表現できるツールもありますが、Qlik Sense では、「軸」にあたる項目を明確に指定することで、様々な軸の分布を見ることができます。反面、軸項目データがない場合は、“RowNo()関数”等を用いて、軸項目データを準備する必要があります。
■おしいチャートの例
グラフ選択の基本を間違えると、有効な情報を得ることができないことがあります。
例えば下図①(「2019年1期」など時系列データを円グラフで表現)や、②(異なるメジャーを積み上げグラフで表現)などは、何を目的にしているかが分かりにくいことを感じて頂けると思います。
他にも、③のように目的に応じたチャートでも項目数が多すぎると見づらくなることがあります。また、④については推移表現に向いている折れ線で比較表現していますが、コンパクトな領域で表現できるので、おしいと言いつつ状況によってはアリかもしれないですね。
しっかりと基本を抑えることができれば、目的を明確にした上であえてはずしたグラフを使うといった高等テクニックも使えるようになります。
■バラつきの把握に便利!分布プロット
では、最後におまけで私がおススメの「分布プロット」をご紹介します。
Qlik Senseには基本としてご紹介した5パターン以外にも多くの種類のチャートを作成することができますが、その中からのご紹介です。
このグラフは、複数軸/1メジャーで構成されており、メジャーに設定した数値の個別の値(軸1ごとの値)を点でプロットしてくれます。また複数軸にすることで、
軸ごとのバラつきを並べて比較することもできるので、俯瞰的にバラつきを捉えたいときに便利です。
この例では、各製造工程におけるリードタイムのバラつきを表現しています。データは[工程名(軸2)][製造番号(軸1)][リードタイム(メジャー)]で構成されており、チャート上の点のひとつひとつが各製造番号となり、チャートの左から右へ行くほどリードタイムが長くなります。
■まとめ■
2回に分けて進めてきた「ビジュアライゼーション」と「グラフ」のまとめです。
・何らかの目的を持ってグラフやクロス集計などで表現したり、情報をイメージすることを
「ビジュアライゼーション」とする。
・グラフの基本構成は、「メジャー」と「軸」であり、これらの組み合わせでグラフが
出来ていることを理解する。
・目的に応じたグラフを利用することで、誰にでも伝わりやすい情報となる。
・まずは、基本的なグラフパターンの特性を抑える。(棒、折れ線、円、コンボ、散布図)
・基本を抑えたら目的に応じて様々な表現にチャレンジする。
Comments