📊 STEP 3: グラフの種類と使い分けの完全ガイド
データの種類に応じた最適なグラフを選ぼう!グラフ選択をマスターすれば可視化の8割は成功
📋 このステップで学ぶこと
- グラフ選択の基本原則
- 比較のためのグラフ(棒グラフ、横棒グラフ)
- 推移のためのグラフ(折れ線グラフ、面グラフ)
- 構成のためのグラフ(円グラフ、ツリーマップ)
- 分布のためのグラフ(ヒストグラム、箱ひげ図)
- 相関のためのグラフ(散布図、バブルチャート)
- 地理データのグラフ(地図、コロプレス図)
🎯 1. グラフ選択の基本原則
なぜグラフ選択が重要なのか
データ可視化で最も重要なスキルの一つが、適切なグラフを選ぶことです。同じデータでも、グラフの種類によって伝わるメッセージが大きく変わります。
例えば、「売上データ」を可視化する場合を考えてみましょう。
- 「どの商品が一番売れているか」を見せたい → 棒グラフ
- 「売上が時間とともにどう変化したか」を見せたい → 折れ線グラフ
- 「各商品が全体の何%を占めるか」を見せたい → 円グラフや積み上げ棒グラフ
このように、「何を伝えたいか」によって最適なグラフが変わるのです。
「何を伝えたいか」でグラフを選ぶ
グラフ選択で最も重要なのは、データの種類ではなく、メッセージです。「このグラフを見た人に、何を理解してほしいか?」を最初に考えましょう。
データ可視化のメッセージは、大きく6つのタイプに分類できます。
| メッセージタイプ | 伝えたいこと | 適したグラフ | 具体例 |
|---|---|---|---|
| 比較 | どちらが大きい/小さい? | 棒グラフ、横棒グラフ | 商品別売上の比較 |
| 推移 | 時間とともにどう変化? | 折れ線グラフ、面グラフ | 月別売上の推移 |
| 構成 | 全体の何%を占める? | 円グラフ、積み上げ棒グラフ | 売上の内訳 |
| 分布 | データはどう散らばる? | ヒストグラム、箱ひげ図 | テストの点数分布 |
| 相関 | 2つの変数に関係は? | 散布図、バブルチャート | 広告費と売上の関係 |
| 地理 | 場所による違いは? | 地図、コロプレス図 | 都道府県別の売上 |
グラフを選ぶときは、以下の5ステップで考えましょう。
| ステップ | やること | 具体例 |
|---|---|---|
| 1. 質問を明確にする | 「〇〇を知りたい」を具体化 | 「どの商品が最も売れているか知りたい」 |
| 2. メッセージタイプを特定 | 6つのうちどれに該当? | 「比較」に該当 |
| 3. 候補グラフを選ぶ | そのタイプに適したグラフは? | 棒グラフまたは横棒グラフ |
| 4. データの特性を考慮 | カテゴリ数、時系列の有無など | 商品が5つなので棒グラフでOK |
| 5. 試作して検証 | 実際に作って、伝わるか確認 | 同僚に見せてフィードバックをもらう |
📊 2. 比較のためのグラフ
「比較」は最も基本的なメッセージタイプです。「AとBではどちらが大きいか?」「5つの商品の中でどれが最も売れているか?」といった疑問に答えます。
棒グラフ(Bar Chart)
棒グラフは、カテゴリ間の値を比較するための最も基本的で、最も使用頻度の高いグラフです。縦の棒の高さで値の大小を表し、一目で比較できます。
| 使う場面 | 具体例 | なぜ棒グラフが適切か |
|---|---|---|
| 商品別の売上を比較 | A商品 100万円、B商品 80万円… | 棒の高さで大小が一目でわかる |
| 店舗別の来客数を比較 | 渋谷店 1000人、新宿店 800人… | 順位がすぐに把握できる |
| 月別の販売数を比較 | 1月 500個、2月 600個… | 各月の独立した値を比較できる |
| カテゴリが3〜10個程度 | 部門別、地域別など | 多すぎず見やすい |
| ルール | 理由 | 悪い例 → 良い例 |
|---|---|---|
| Y軸は必ず0から | 高さで比較するため、0から始めないと誤解を招く | Y軸が50から → Y軸が0から |
| 降順に並べる | ランキングを見せたい場合、大きい順が見やすい | アルファベット順 → 売上順 |
| 棒の間隔は幅の50%程度 | 詰まりすぎず、離れすぎず見やすい | 隙間なし → 適度な間隔 |
| 色は最小限に | 重要な棒だけ目立たせる | 10色使用 → 1色+グレー |
| 直接ラベルを使用 | 棒の上に数値を表示すると読みやすい | 値なし → 値を棒の上に表示 |
横棒グラフ(Horizontal Bar Chart)
横棒グラフは、棒グラフを横向きにしたものです。見た目は似ていますが、使い分けるポイントがあります。
| 状況 | なぜ横棒グラフが良いか | 具体例 |
|---|---|---|
| カテゴリ名が長い | 横書きでラベルが読みやすい | 「東京都渋谷区道玄坂店」など |
| カテゴリ数が多い(10個以上) | 縦に長くなるので見やすい | 47都道府県のデータ |
| ランキングを表示 | 上から順に読む習慣に合う | 売上トップ10店舗 |
グループ化棒グラフ(Grouped Bar Chart)
グループ化棒グラフは、同じカテゴリ内で複数の値を並べて比較したい場合に使います。例えば、「各商品の今年と去年の売上を比較する」といった場面です。
- 時期の比較:今年 vs 去年、今月 vs 先月
- グループの比較:男性 vs 女性、オンライン vs オフライン
- 計画 vs 実績:目標値 vs 実績値
| 間違い | なぜ問題か | 正しい対処法 |
|---|---|---|
| カテゴリが多すぎる(15個以上) | 見にくく、比較が困難 | 上位10個 + 「その他」にまとめる |
| Y軸が0から始まらない | 差が誇張されて見える | 必ずY軸を0から開始する |
| 3D棒グラフを使う | 遠近感で値が歪んで見える | 必ず2D(平面)の棒グラフを使用 |
| 時系列データに使う | 変化の連続性が見えにくい | 時系列なら折れ線グラフを検討 |
📈 3. 推移のためのグラフ
「推移」は、時間の経過に伴うデータの変化を示すメッセージタイプです。「売上は増えているか?減っているか?」「いつピークを迎えたか?」といった疑問に答えます。
折れ線グラフ(Line Chart)
折れ線グラフは、時間の経過とともにデータがどう変化したかを示す最も基本的なグラフです。点を線で結ぶことで、トレンド(傾向)が視覚的に理解しやすくなります。
| 使う場面 | 具体例 | なぜ折れ線グラフが適切か |
|---|---|---|
| 時系列データ | 月別、四半期別、年別のデータ | 時間の流れに沿った変化が見える |
| トレンドを見たい | 売上の上昇・下降・横ばい | 線の傾きで傾向がわかる |
| データポイントが多い | 日別データ(365ポイント) | 棒グラフより見やすい |
| 複数系列の比較 | 商品A・B・Cの売上推移 | 複数の線を重ねて比較できる |
| ルール | 説明 | 具体的なやり方 |
|---|---|---|
| Y軸の範囲 | 棒グラフと違い、0から始めなくてもOK | 変化の傾向を見せたい場合は調整可 |
| 線の数は3〜5本まで | 多すぎると見にくい | 6本以上は別のグラフに分割 |
| 重要な線だけハイライト | 注目してほしい線を目立たせる | メインを太く・濃く、他は薄く |
| 直接ラベルを使用 | 凡例を見に行く手間を省く | 線の端に系列名を表示 |
| 点の表示 | データポイントが少ない場合は点も表示 | 15個未満なら点を付ける |
面グラフ(Area Chart)
面グラフは、折れ線グラフの下側を塗りつぶしたものです。量の大きさを視覚的に強調したい場合に効果的です。
| 特徴 | いつ使う | 注意点 |
|---|---|---|
| 量を強調できる | 累積効果を見せたい(総販売数など) | 塗りつぶしが重なると見にくい |
| 視覚的インパクト | 成長を印象的に見せたい | 複数系列には不向き |
| 積み上げ可能 | 全体と各部分の推移を同時に見せたい | 下の系列は上の系列に隠れる |
積み上げ面グラフ(Stacked Area Chart)
積み上げ面グラフは、複数のカテゴリを積み上げて、全体の推移と各カテゴリの貢献度を同時に見せるグラフです。
- 売上の内訳推移:商品A・B・Cの売上がどう変化したか、全体でいくらか
- ユーザー構成の推移:新規・リピーターの比率がどう変化したか
- コスト構成の推移:人件費・材料費・その他がどう変化したか
| 間違い | なぜ問題か | 正しい対処法 |
|---|---|---|
| 離散データに使う | 「商品別売上」など順序に意味がないデータには不適 | 離散データには棒グラフを使用 |
| 線が交差しすぎる | どの線がどれか判別困難 | 色を工夫するか、グラフを分割 |
| 欠損値を無視 | データがない期間が「0」と誤解される | 破線や注釈で欠損を明示 |
🥧 4. 構成のためのグラフ
「構成」は、全体を100%として、各部分が何%を占めるかを示すメッセージタイプです。「売上の内訳はどうなっているか?」「市場シェアはどのくらいか?」といった疑問に答えます。
円グラフ(Pie Chart)
円グラフは、全体を円で表し、各部分を扇形で示すグラフです。非常に馴染みのあるグラフですが、実は使いどころが限られています。
以下のすべての条件を満たす場合のみ、円グラフを使いましょう。
- カテゴリが3〜5個以内(それ以上は見にくい)
- 「全体に対する割合」が重要(合計100%であることを示したい)
- 1つのカテゴリが50%以上を占める(そうでないと差がわかりにくい)
- 複数の円を比較しない(人間は角度の比較が苦手)
| 状況 | なぜ問題か | 代わりに使うグラフ |
|---|---|---|
| カテゴリが6個以上 | 扇形が小さくなり判別困難 | 横棒グラフ |
| 値が近い(25%と28%など) | 角度の差が見分けられない | 横棒グラフ |
| 複数の円を比較したい | 人間は角度の比較が苦手 | 100%積み上げ棒グラフ |
| 時系列で構成を比較 | 複数の円を並べても変化がわからない | 積み上げ面グラフ |
| 3D円グラフ | 遠近感で手前が大きく見える | 2Dの円グラフまたは棒グラフ |
多くの場合、円グラフより横棒グラフの方が比較しやすく効果的です。
積み上げ棒グラフ(Stacked Bar Chart)
積み上げ棒グラフは、1つの棒の中に複数のカテゴリを積み上げて、構成比を示すグラフです。時系列で構成比がどう変化したかを見せたい場合に特に有効です。
| 種類 | 特徴 | いつ使う |
|---|---|---|
| 通常の積み上げ棒グラフ | 実数を積み上げ、合計値も見える | 全体量と内訳を同時に見せたい |
| 100%積み上げ棒グラフ | すべて100%になるよう正規化 | 構成比の変化だけを見せたい |
ツリーマップ(Treemap)
ツリーマップは、長方形の面積で値の大きさを、入れ子構造で階層を表現するグラフです。カテゴリが多い場合や、階層構造がある場合に有効です。
- 階層構造がある場合:地域→都道府県→市区町村など
- カテゴリが多い場合:10個以上の項目を一度に表示
- 面積で直感的に理解:大きな四角=大きな値
- 限られたスペースに多くの情報:ダッシュボードに最適
📊 5. 分布のためのグラフ
「分布」は、データがどのように散らばっているかを示すメッセージタイプです。「テストの点数はどのあたりに集中しているか?」「平均値と中央値はどのくらい違うか?」といった疑問に答えます。
ヒストグラム(Histogram)
ヒストグラムは、連続的なデータを区間(ビン)に分けて、各区間に何個のデータが含まれるかを棒で表すグラフです。見た目は棒グラフに似ていますが、意味が異なります。
| 使う場面 | 具体例 | 何がわかるか |
|---|---|---|
| 点数の分布を見たい | テストの点数(0〜100点) | 何点台の人が多いか |
| 年齢の分布を見たい | 顧客の年齢分布 | どの年齢層が多いか |
| 偏りや外れ値を発見 | 商品の価格分布 | 極端に高い/安いものがあるか |
| 正規分布かどうか確認 | 測定データ | 釣鐘型になっているか |
見た目は似ていますが、データの性質と目的が異なります。
| 項目 | ヒストグラム | 棒グラフ |
|---|---|---|
| データの種類 | 連続データ(身長、年齢、温度) | 離散データ(商品、店舗、月) |
| 棒の隙間 | 隙間なし(連続性を表現) | 隙間あり(独立したカテゴリ) |
| X軸の意味 | 数値の範囲(区間) | カテゴリ名 |
| 目的 | 分布の形を見る | カテゴリ間の比較 |
箱ひげ図(Box Plot)
箱ひげ図は、データのばらつきを視覚化するグラフです。最小値、第1四分位数(25%)、中央値(50%)、第3四分位数(75%)、最大値の5つの統計量を1つの図で表現します。
- 複数グループのばらつきを比較:クラスA・B・Cのテスト点数
- 外れ値を発見:異常に高い/低い値を見つける
- 中央値と平均の違いを見る:データの歪みを確認
- 統計的な分析結果を示す:論文やレポートで使用
バイオリン図(Violin Plot)
バイオリン図は、箱ひげ図とヒストグラムを組み合わせたようなグラフです。データのばらつきだけでなく、密度(どこに多くのデータが集中しているか)も同時に表現できます。
📉 6. 相関のためのグラフ
「相関」は、2つ以上の変数の間に関係があるかどうかを示すメッセージタイプです。「広告費を増やすと売上は増えるか?」「勉強時間と成績に関係はあるか?」といった疑問に答えます。
散布図(Scatter Plot)
散布図は、2つの変数の関係性を点で表示するグラフです。X軸とY軸にそれぞれ変数を配置し、各データポイントを点として描画します。
| 使う場面 | X軸 | Y軸 | 何がわかるか |
|---|---|---|---|
| 相関の確認 | 広告費 | 売上 | 広告費と売上に関係があるか |
| 外れ値の発見 | 経験年数 | 年収 | 異常に高い/低い年収の人 |
| クラスターの特定 | 購入頻度 | 購入金額 | 顧客のグループ分け |
| 因果関係の仮説検証 | 勉強時間 | テスト点数 | 勉強すると点数が上がるか |
| パターン | グラフの形 | 意味 | 例 |
|---|---|---|---|
| 正の相関 | 右上がりの分布 | Xが増えるとYも増える | 広告費と売上 |
| 負の相関 | 右下がりの分布 | Xが増えるとYは減る | 価格と販売数 |
| 無相関 | バラバラの分布 | XとYに関係がない | 身長と数学の成績 |
バブルチャート(Bubble Chart)
バブルチャートは、散布図に点のサイズを追加して、3つ目の変数を表現するグラフです。さらに色を使えば、4つの変数を同時に表現できます。
| 要素 | 表現する変数 | 具体例 |
|---|---|---|
| X軸 | 変数1 | 広告費 |
| Y軸 | 変数2 | 売上 |
| バブルのサイズ | 変数3 | 顧客数 |
| バブルの色 | カテゴリまたは変数4 | 地域(東日本/西日本) |
ヒートマップ(Heatmap)
ヒートマップは、複数の変数間の相関係数を色で表現するグラフです。濃い色ほど相関が強いことを示します。特に、多くの変数間の関係を一度に把握したい場合に有効です。
🗺️ 7. 地理データのためのグラフ
「地理」は、場所による違いを示すメッセージタイプです。「どの地域で売上が高いか?」「どこに顧客が集中しているか?」といった疑問に答えます。
地図(Map)
地図は、地理的な位置にデータをマッピングするグラフです。場所による違いを直感的に理解できます。
- 店舗の位置と売上:マーカーのサイズで売上を表現
- 顧客の分布:どこに顧客が多いか
- 配送ルート:最適な経路の可視化
- イベントの発生場所:事故多発地点、犯罪発生場所など
コロプレス図(Choropleth Map)
コロプレス図は、地図の各地域を色で塗り分けて、値の大小を表現するグラフです。都道府県別や国別のデータを可視化する際によく使われます。
- 都道府県別の人口密度:濃い色=人口密度が高い
- 市区町村別の感染者数:濃い色=感染者が多い
- 国別のGDP:濃い色=GDPが高い
- 選挙結果:地域ごとの支持政党を色分け
| データの種類 | 推奨する色使い | 具体例 |
|---|---|---|
| 順序データ | 単色のグラデーション(薄い→濃い) | 人口密度(薄い青→濃い青) |
| 発散データ | 2色のグラデーション(青←白→赤) | 前年比(減少=青、増加=赤) |
| カテゴリデータ | 異なる色(判別しやすい色) | 地域区分、所属グループ |
🔍 8. グラフ選択のフローチャート
最後に、グラフ選択を素早く行うための決定木をまとめます。「何を伝えたいか?」を起点に、最適なグラフを選びましょう。
※横スクロールできます
📝 STEP 3 のまとめ
| メッセージタイプ | 主なグラフ | ポイント |
|---|---|---|
| グラフ選択の原則 | − | 「何を伝えたいか」でグラフを選ぶ |
| 比較 | 棒グラフ、横棒グラフ | Y軸は0から、降順に並べる |
| 推移 | 折れ線グラフ、面グラフ | 時系列データに使用、線は5本まで |
| 構成 | 円グラフ、積み上げ棒グラフ | 円グラフより横棒グラフ推奨 |
| 分布 | ヒストグラム、箱ひげ図 | 連続データの散らばりを可視化 |
| 相関 | 散布図、バブルチャート | 正の相関、負の相関、無相関 |
| 地理 | 地図、コロプレス図 | 場所による違いを直感的に表現 |
グラフ選択は「データの種類」ではなく「メッセージ」に基づいて行います。
同じデータでも、伝えたいことが違えば、使うべきグラフも変わります。「このデータはどんなストーリーを語っているのか?」「見る人に何を理解してもらいたいのか?」を常に考えましょう。
次のステップでは、グラフをより美しく効果的にする「色彩理論」を学びます!
📝 実践演習
以下の状況に最適なグラフを選んでください。
「5つの商品の今月の売上を比較したい」
理由:
- メッセージタイプは「比較」:どの商品が最も売れているかを比較したい
- カテゴリ数が5個:棒グラフに適した数(3〜10個が目安)
- 時系列データではない:折れ線グラフは不適
- 棒の高さで大小を直感的に比較できる
追加のアドバイス:売上の降順に並べると、どの商品が最も売れているかが一目でわかります。また、最も売れている商品だけ色を変えてハイライトすると、さらに効果的です。
以下の2つの状況で、それぞれ適切なグラフを選び、理由を説明してください。
A: 「2020年から2024年までの月別売上の推移を見たい」
B: 「全社員の年齢分布を知りたい」
A: 折れ線グラフ
- メッセージタイプは「推移」:時間とともにどう変化したかを見たい
- 時系列データ:2020-2024年の月別 = 60ポイント
- データポイントが多い:棒グラフより折れ線グラフが見やすい
- トレンドがわかる:上昇・下降・横ばいの傾向が一目でわかる
B: ヒストグラム
- メッセージタイプは「分布」:データがどう散らばっているかを見たい
- 連続データ:年齢は連続的な数値データ
- 度数分布がわかる:どの年齢層に何人いるかが一目でわかる
- 例:20-29歳、30-39歳、40-49歳…のように区間に分けて表示
あなたは経営会議で「当社の主力3商品(A、B、C)の売上構成が、この5年間でどう変化したか」を報告する必要があります。最適なグラフを選び、その理由を説明してください。また、そのグラフで何を強調すべきか提案してください。
理由:
- メッセージタイプは「構成」+「推移」の複合:構成比がどう変化したかを見せたい
- 時系列での構成比の変化:円グラフを5つ並べるより見やすい
- 3商品の相対的な貢献度:各商品のシェアの変化が一目でわかる
- 全体の売上トレンドも見える(積み上げ面グラフの場合)
強調すべきポイント:
- 最も成長した商品を明るい色でハイライト(例:商品Aが成長したなら、Aを目立つ色に)
- 構成比が変化した時期に注釈を追加(例:「2022年4月 新商品投入」など)
- タイトルで結論を伝える(例:「商品Aのシェアが5年で20%→35%に拡大」)
- 各商品の直近の構成比を直接ラベルで表示(例:A: 35%, B: 40%, C: 25%)
補足:100%積み上げ棒グラフは構成比の変化だけに焦点を当てたい場合に、積み上げ面グラフは全体の売上額も同時に見せたい場合に適しています。
❓ よくある質問
学習メモ
データ可視化マスター - Step 3