STEP 3:グラフの種類と使い分けの完全ガイド

📊 STEP 3: グラフの種類と使い分けの完全ガイド

データの種類に応じた最適なグラフを選ぼう!グラフ選択をマスターすれば可視化の8割は成功

📋 このステップで学ぶこと

  • グラフ選択の基本原則
  • 比較のためのグラフ(棒グラフ、横棒グラフ)
  • 推移のためのグラフ(折れ線グラフ、面グラフ)
  • 構成のためのグラフ(円グラフ、ツリーマップ)
  • 分布のためのグラフ(ヒストグラム、箱ひげ図)
  • 相関のためのグラフ(散布図、バブルチャート)
  • 地理データのグラフ(地図、コロプレス図)

🎯 1. グラフ選択の基本原則

なぜグラフ選択が重要なのか

データ可視化で最も重要なスキルの一つが、適切なグラフを選ぶことです。同じデータでも、グラフの種類によって伝わるメッセージが大きく変わります。

例えば、「売上データ」を可視化する場合を考えてみましょう。

  • 「どの商品が一番売れているか」を見せたい → 棒グラフ
  • 「売上が時間とともにどう変化したか」を見せたい → 折れ線グラフ
  • 「各商品が全体の何%を占めるか」を見せたい → 円グラフ積み上げ棒グラフ

このように、「何を伝えたいか」によって最適なグラフが変わるのです。

「何を伝えたいか」でグラフを選ぶ

グラフ選択で最も重要なのは、データの種類ではなく、メッセージです。「このグラフを見た人に、何を理解してほしいか?」を最初に考えましょう。

📊 6つの基本的なメッセージタイプ

データ可視化のメッセージは、大きく6つのタイプに分類できます。

メッセージタイプ 伝えたいこと 適したグラフ 具体例
比較 どちらが大きい/小さい? 棒グラフ、横棒グラフ 商品別売上の比較
推移 時間とともにどう変化? 折れ線グラフ、面グラフ 月別売上の推移
構成 全体の何%を占める? 円グラフ、積み上げ棒グラフ 売上の内訳
分布 データはどう散らばる? ヒストグラム、箱ひげ図 テストの点数分布
相関 2つの変数に関係は? 散布図、バブルチャート 広告費と売上の関係
地理 場所による違いは? 地図、コロプレス図 都道府県別の売上
💡 グラフ選択の5ステップ思考プロセス

グラフを選ぶときは、以下の5ステップで考えましょう。

ステップ やること 具体例
1. 質問を明確にする 「〇〇を知りたい」を具体化 「どの商品が最も売れているか知りたい」
2. メッセージタイプを特定 6つのうちどれに該当? 「比較」に該当
3. 候補グラフを選ぶ そのタイプに適したグラフは? 棒グラフまたは横棒グラフ
4. データの特性を考慮 カテゴリ数、時系列の有無など 商品が5つなので棒グラフでOK
5. 試作して検証 実際に作って、伝わるか確認 同僚に見せてフィードバックをもらう

📊 2. 比較のためのグラフ

「比較」は最も基本的なメッセージタイプです。「AとBではどちらが大きいか?」「5つの商品の中でどれが最も売れているか?」といった疑問に答えます。

棒グラフ(Bar Chart)

棒グラフは、カテゴリ間の値を比較するための最も基本的で、最も使用頻度の高いグラフです。縦の棒の高さで値の大小を表し、一目で比較できます。

📌 棒グラフはこんなときに使う
使う場面 具体例 なぜ棒グラフが適切か
商品別の売上を比較 A商品 100万円、B商品 80万円… 棒の高さで大小が一目でわかる
店舗別の来客数を比較 渋谷店 1000人、新宿店 800人… 順位がすぐに把握できる
月別の販売数を比較 1月 500個、2月 600個… 各月の独立した値を比較できる
カテゴリが3〜10個程度 部門別、地域別など 多すぎず見やすい
✅ 棒グラフを作るときのベストプラクティス
ルール 理由 悪い例 → 良い例
Y軸は必ず0から 高さで比較するため、0から始めないと誤解を招く Y軸が50から → Y軸が0から
降順に並べる ランキングを見せたい場合、大きい順が見やすい アルファベット順 → 売上順
棒の間隔は幅の50%程度 詰まりすぎず、離れすぎず見やすい 隙間なし → 適度な間隔
色は最小限に 重要な棒だけ目立たせる 10色使用 → 1色+グレー
直接ラベルを使用 棒の上に数値を表示すると読みやすい 値なし → 値を棒の上に表示
【例】商品別売上の棒グラフ 売上(万円) 200┤ ██ │ ██ 150┤ ██ ██ │ ██ ██ 100┤ ██ ██ ██ │ ██ ██ ██ 50┤ ██ ██ ██ ██ │ ██ ██ ██ ██ 0└────────────────── 商品A 商品B 商品C 商品D 200 150 100 50 【ポイント】 ✅ Y軸は0から開始 ✅ 降順(大→小)に並べてある ✅ 各棒の上に値を直接表示 ✅ 商品Aが最も売れていることが一目でわかる

横棒グラフ(Horizontal Bar Chart)

横棒グラフは、棒グラフを横向きにしたものです。見た目は似ていますが、使い分けるポイントがあります。

📌 横棒グラフはこんなときに使う
状況 なぜ横棒グラフが良いか 具体例
カテゴリ名が長い 横書きでラベルが読みやすい 「東京都渋谷区道玄坂店」など
カテゴリ数が多い(10個以上) 縦に長くなるので見やすい 47都道府県のデータ
ランキングを表示 上から順に読む習慣に合う 売上トップ10店舗
【例】店舗別売上ランキング(横棒グラフ) 渋谷駅前店 ████████████████ 160万 新宿西口店 ████████████ 120万 池袋東口店 ██████████ 100万 品川駅店 ████████ 80万 横浜駅店 ██████ 60万 【ポイント】 ✅ 店舗名が長くても読みやすい ✅ 上から下にランキング順 ✅ 値を右端に直接表示 ✅ 視線が自然に流れる(左→右、上→下)

グループ化棒グラフ(Grouped Bar Chart)

グループ化棒グラフは、同じカテゴリ内で複数の値を並べて比較したい場合に使います。例えば、「各商品の今年と去年の売上を比較する」といった場面です。

📌 グループ化棒グラフの使いどころ
  • 時期の比較:今年 vs 去年、今月 vs 先月
  • グループの比較:男性 vs 女性、オンライン vs オフライン
  • 計画 vs 実績:目標値 vs 実績値
【例】商品別・年度別売上の比較 売上(万円) 200┤ ██ │ ██ ▓▓ 150┤ ██ ▓▓ ██ │ ██ ▓▓ ██ ▓▓ 100┤ ██ ▓▓ ██ ▓▓ ██ ▓▓ │ ██ ▓▓ ██ ▓▓ ██ ▓▓ 0└──────────────────────── 商品A 商品B 商品C ██ 2024年 ▓▓ 2023年 【読み取れること】 ・商品Aは前年より大きく成長 ・商品Bはほぼ横ばい ・商品Cは前年よりやや減少
⚠️ 棒グラフでよくある間違い
間違い なぜ問題か 正しい対処法
カテゴリが多すぎる(15個以上) 見にくく、比較が困難 上位10個 + 「その他」にまとめる
Y軸が0から始まらない 差が誇張されて見える 必ずY軸を0から開始する
3D棒グラフを使う 遠近感で値が歪んで見える 必ず2D(平面)の棒グラフを使用
時系列データに使う 変化の連続性が見えにくい 時系列なら折れ線グラフを検討

📈 3. 推移のためのグラフ

「推移」は、時間の経過に伴うデータの変化を示すメッセージタイプです。「売上は増えているか?減っているか?」「いつピークを迎えたか?」といった疑問に答えます。

折れ線グラフ(Line Chart)

折れ線グラフは、時間の経過とともにデータがどう変化したかを示す最も基本的なグラフです。点を線で結ぶことで、トレンド(傾向)が視覚的に理解しやすくなります。

📌 折れ線グラフはこんなときに使う
使う場面 具体例 なぜ折れ線グラフが適切か
時系列データ 月別、四半期別、年別のデータ 時間の流れに沿った変化が見える
トレンドを見たい 売上の上昇・下降・横ばい 線の傾きで傾向がわかる
データポイントが多い 日別データ(365ポイント) 棒グラフより見やすい
複数系列の比較 商品A・B・Cの売上推移 複数の線を重ねて比較できる
✅ 折れ線グラフのベストプラクティス
ルール 説明 具体的なやり方
Y軸の範囲 棒グラフと違い、0から始めなくてもOK 変化の傾向を見せたい場合は調整可
線の数は3〜5本まで 多すぎると見にくい 6本以上は別のグラフに分割
重要な線だけハイライト 注目してほしい線を目立たせる メインを太く・濃く、他は薄く
直接ラベルを使用 凡例を見に行く手間を省く 線の端に系列名を表示
点の表示 データポイントが少ない場合は点も表示 15個未満なら点を付ける
【例】月別売上推移(折れ線グラフ) 売上(万円) 500┤ ●───● 商品A │ ●─● 400┤ ●─● │ ●─● 300┤ ●─● ▲───▲ 商品B │ ●─● ▲─▲ 200┤●─● ▲─▲ │ ▲─▲ 100┤ ▲─▲ │ 0└──────────────────────────────── 1月 3月 5月 7月 9月 11月 【読み取れること】 ・商品Aは右肩上がりで成長中 ・商品Bは横ばいから緩やかに上昇 ・商品Aは商品Bより成長率が高い

面グラフ(Area Chart)

面グラフは、折れ線グラフの下側を塗りつぶしたものです。量の大きさを視覚的に強調したい場合に効果的です。

📌 面グラフの特徴と使いどころ
特徴 いつ使う 注意点
量を強調できる 累積効果を見せたい(総販売数など) 塗りつぶしが重なると見にくい
視覚的インパクト 成長を印象的に見せたい 複数系列には不向き
積み上げ可能 全体と各部分の推移を同時に見せたい 下の系列は上の系列に隠れる

積み上げ面グラフ(Stacked Area Chart)

積み上げ面グラフは、複数のカテゴリを積み上げて、全体の推移と各カテゴリの貢献度を同時に見せるグラフです。

💡 積み上げ面グラフが適している場面
  • 売上の内訳推移:商品A・B・Cの売上がどう変化したか、全体でいくらか
  • ユーザー構成の推移:新規・リピーターの比率がどう変化したか
  • コスト構成の推移:人件費・材料費・その他がどう変化したか
⚠️ 折れ線グラフでよくある間違い
間違い なぜ問題か 正しい対処法
離散データに使う 「商品別売上」など順序に意味がないデータには不適 離散データには棒グラフを使用
線が交差しすぎる どの線がどれか判別困難 色を工夫するか、グラフを分割
欠損値を無視 データがない期間が「0」と誤解される 破線や注釈で欠損を明示

🥧 4. 構成のためのグラフ

「構成」は、全体を100%として、各部分が何%を占めるかを示すメッセージタイプです。「売上の内訳はどうなっているか?」「市場シェアはどのくらいか?」といった疑問に答えます。

円グラフ(Pie Chart)

円グラフは、全体を円で表し、各部分を扇形で示すグラフです。非常に馴染みのあるグラフですが、実は使いどころが限られています

📌 円グラフが適している条件

以下のすべての条件を満たす場合のみ、円グラフを使いましょう。

  • カテゴリが3〜5個以内(それ以上は見にくい)
  • 「全体に対する割合」が重要(合計100%であることを示したい)
  • 1つのカテゴリが50%以上を占める(そうでないと差がわかりにくい)
  • 複数の円を比較しない(人間は角度の比較が苦手)
❌ 円グラフが適さない場合(よくある誤用)
状況 なぜ問題か 代わりに使うグラフ
カテゴリが6個以上 扇形が小さくなり判別困難 横棒グラフ
値が近い(25%と28%など) 角度の差が見分けられない 横棒グラフ
複数の円を比較したい 人間は角度の比較が苦手 100%積み上げ棒グラフ
時系列で構成を比較 複数の円を並べても変化がわからない 積み上げ面グラフ
3D円グラフ 遠近感で手前が大きく見える 2Dの円グラフまたは棒グラフ
✅ 円グラフの代わりに横棒グラフを使おう

多くの場合、円グラフより横棒グラフの方が比較しやすく効果的です。

【円グラフ vs 横棒グラフの比較】 【円グラフ】 【横棒グラフ(推奨)】 ╱───╲ ╱ A:35%╲ A: 35% ████████████████ │ │ B: 30% ██████████████ ╲ B:30%╱ C: 20% ██████████ ╲───╱ D: 15% ████████ C:20% D:15% 【なぜ横棒グラフが良いか】 ✅ 値の差が明確にわかる ✅ 細かい差(30% vs 35%)も判別しやすい ✅ カテゴリが増えても見やすい ✅ パーセントを直接表示できる

積み上げ棒グラフ(Stacked Bar Chart)

積み上げ棒グラフは、1つの棒の中に複数のカテゴリを積み上げて、構成比を示すグラフです。時系列で構成比がどう変化したかを見せたい場合に特に有効です。

📌 積み上げ棒グラフの種類
種類 特徴 いつ使う
通常の積み上げ棒グラフ 実数を積み上げ、合計値も見える 全体量と内訳を同時に見せたい
100%積み上げ棒グラフ すべて100%になるよう正規化 構成比の変化だけを見せたい

ツリーマップ(Treemap)

ツリーマップは、長方形の面積で値の大きさを、入れ子構造で階層を表現するグラフです。カテゴリが多い場合や、階層構造がある場合に有効です。

📌 ツリーマップの特徴と使いどころ
  • 階層構造がある場合:地域→都道府県→市区町村など
  • カテゴリが多い場合:10個以上の項目を一度に表示
  • 面積で直感的に理解:大きな四角=大きな値
  • 限られたスペースに多くの情報:ダッシュボードに最適

📊 5. 分布のためのグラフ

「分布」は、データがどのように散らばっているかを示すメッセージタイプです。「テストの点数はどのあたりに集中しているか?」「平均値と中央値はどのくらい違うか?」といった疑問に答えます。

ヒストグラム(Histogram)

ヒストグラムは、連続的なデータを区間(ビン)に分けて、各区間に何個のデータが含まれるかを棒で表すグラフです。見た目は棒グラフに似ていますが、意味が異なります。

📌 ヒストグラムはこんなときに使う
使う場面 具体例 何がわかるか
点数の分布を見たい テストの点数(0〜100点) 何点台の人が多いか
年齢の分布を見たい 顧客の年齢分布 どの年齢層が多いか
偏りや外れ値を発見 商品の価格分布 極端に高い/安いものがあるか
正規分布かどうか確認 測定データ 釣鐘型になっているか
【例】テストの点数分布(ヒストグラム) 人数 20┤ ████ │ ████████ 15┤ ████████████ │ ████████████████ 10┤ ████████████████████ │████████████████████████ 5┤████████████████████████ │████████████████████████ 0└────────────────────────── 0 20 40 60 80 100(点) 【読み取れること】 ・60〜80点の人が最も多い(山の頂上) ・分布は左右対称に近い(正規分布的) ・0〜20点の人は少ない(低得点者は少数) ・90点以上の人も一定数いる
💡 ヒストグラム vs 棒グラフ – 何が違う?

見た目は似ていますが、データの性質と目的が異なります。

項目 ヒストグラム 棒グラフ
データの種類 連続データ(身長、年齢、温度) 離散データ(商品、店舗、月)
棒の隙間 隙間なし(連続性を表現) 隙間あり(独立したカテゴリ)
X軸の意味 数値の範囲(区間) カテゴリ名
目的 分布の形を見る カテゴリ間の比較

箱ひげ図(Box Plot)

箱ひげ図は、データのばらつきを視覚化するグラフです。最小値、第1四分位数(25%)、中央値(50%)、第3四分位数(75%)、最大値の5つの統計量を1つの図で表現します。

📌 箱ひげ図の読み方
【箱ひげ図の構造】 最大値 │ │ ← 上のひげ ┌───┴───┐ │ │ 第3四分位数(75%) │ ─ │ ← 中央値(50%) │ │ 第1四分位数(25%) └───┬───┘ │ ← 下のひげ │ 最小値 ○ ← 外れ値(ひげの範囲外) 【読み取れること】 ・箱の長さ = データのばらつき(長いほどばらつきが大きい) ・中央の線 = 中央値(データの真ん中の値) ・ひげの長さ = データの範囲 ・○ = 外れ値(異常に大きい/小さい値)
📌 箱ひげ図はこんなときに使う
  • 複数グループのばらつきを比較:クラスA・B・Cのテスト点数
  • 外れ値を発見:異常に高い/低い値を見つける
  • 中央値と平均の違いを見る:データの歪みを確認
  • 統計的な分析結果を示す:論文やレポートで使用

バイオリン図(Violin Plot)

バイオリン図は、箱ひげ図とヒストグラムを組み合わせたようなグラフです。データのばらつきだけでなく、密度(どこに多くのデータが集中しているか)も同時に表現できます。

📉 6. 相関のためのグラフ

「相関」は、2つ以上の変数の間に関係があるかどうかを示すメッセージタイプです。「広告費を増やすと売上は増えるか?」「勉強時間と成績に関係はあるか?」といった疑問に答えます。

散布図(Scatter Plot)

散布図は、2つの変数の関係性を点で表示するグラフです。X軸とY軸にそれぞれ変数を配置し、各データポイントを点として描画します。

📌 散布図はこんなときに使う
使う場面 X軸 Y軸 何がわかるか
相関の確認 広告費 売上 広告費と売上に関係があるか
外れ値の発見 経験年数 年収 異常に高い/低い年収の人
クラスターの特定 購入頻度 購入金額 顧客のグループ分け
因果関係の仮説検証 勉強時間 テスト点数 勉強すると点数が上がるか
【例】勉強時間とテスト点数の関係(散布図) 点数 100┤ ● │ ● ● 80┤ ● ● │ ● ● ● 60┤ ● ● │ ● ● 40┤ ● ● │● ● 20┤● │ 0└────────────────────── 0 2 4 6 8 10(時間) 【読み取れること】 ・右上がりの傾向 = 正の相関がある ・勉強時間が長いほど、点数が高い傾向 ・完全に直線ではない = 他の要因もある
📊 相関の3つのパターン
パターン グラフの形 意味
正の相関 右上がりの分布 Xが増えるとYも増える 広告費と売上
負の相関 右下がりの分布 Xが増えるとYは減る 価格と販売数
無相関 バラバラの分布 XとYに関係がない 身長と数学の成績

バブルチャート(Bubble Chart)

バブルチャートは、散布図に点のサイズを追加して、3つ目の変数を表現するグラフです。さらに色を使えば、4つの変数を同時に表現できます。

📌 バブルチャートで表現できる変数
要素 表現する変数 具体例
X軸 変数1 広告費
Y軸 変数2 売上
バブルのサイズ 変数3 顧客数
バブルの色 カテゴリまたは変数4 地域(東日本/西日本)

ヒートマップ(Heatmap)

ヒートマップは、複数の変数間の相関係数を色で表現するグラフです。濃い色ほど相関が強いことを示します。特に、多くの変数間の関係を一度に把握したい場合に有効です。

🗺️ 7. 地理データのためのグラフ

「地理」は、場所による違いを示すメッセージタイプです。「どの地域で売上が高いか?」「どこに顧客が集中しているか?」といった疑問に答えます。

地図(Map)

地図は、地理的な位置にデータをマッピングするグラフです。場所による違いを直感的に理解できます。

📌 地図を使う場面
  • 店舗の位置と売上:マーカーのサイズで売上を表現
  • 顧客の分布:どこに顧客が多いか
  • 配送ルート:最適な経路の可視化
  • イベントの発生場所:事故多発地点、犯罪発生場所など

コロプレス図(Choropleth Map)

コロプレス図は、地図の各地域を色で塗り分けて、値の大小を表現するグラフです。都道府県別や国別のデータを可視化する際によく使われます。

📌 コロプレス図の使用例
  • 都道府県別の人口密度:濃い色=人口密度が高い
  • 市区町村別の感染者数:濃い色=感染者が多い
  • 国別のGDP:濃い色=GDPが高い
  • 選挙結果:地域ごとの支持政党を色分け
🌈 地図の色使いのルール
データの種類 推奨する色使い 具体例
順序データ 単色のグラデーション(薄い→濃い) 人口密度(薄い青→濃い青)
発散データ 2色のグラデーション(青←白→赤) 前年比(減少=青、増加=赤)
カテゴリデータ 異なる色(判別しやすい色) 地域区分、所属グループ

🔍 8. グラフ選択のフローチャート

最後に、グラフ選択を素早く行うための決定木をまとめます。「何を伝えたいか?」を起点に、最適なグラフを選びましょう。

※横スクロールできます

何を伝えたい? │ ├─【比較】カテゴリ間の大小を比較したい │ ├─ カテゴリが少ない(10個未満)──→ 棒グラフ │ ├─ カテゴリ名が長い ──────────→ 横棒グラフ │ ├─ ランキングを見せたい ────────→ 横棒グラフ(降順) │ └─ 複数系列を比較(今年vs去年)───→ グループ化棒グラフ │ ├─【推移】時間による変化を見せたい │ ├─ トレンドを見たい ──────────→ 折れ線グラフ │ ├─ 量の大きさを強調したい ─────→ 面グラフ │ └─ 構成比の推移を見せたい ────→ 積み上げ面グラフ │ ├─【構成】全体の何%かを見せたい │ ├─ カテゴリが少ない(5個未満)───→ 円グラフ ※条件付き │ ├─ カテゴリが多い ───────────→ 横棒グラフ(推奨) │ ├─ 時系列で構成を比較 ─────────→ 積み上げ棒グラフ │ └─ 階層構造がある ───────────→ ツリーマップ │ ├─【分布】データの散らばりを見たい │ ├─ 度数分布を見たい ──────────→ ヒストグラム │ ├─ 複数グループのばらつき比較 ──→ 箱ひげ図 │ └─ 密度も同時に見たい ─────────→ バイオリン図 │ ├─【相関】2つの変数の関係を見たい │ ├─ 2変数の関係 ────────────→ 散布図 │ ├─ 3変数以上の関係 ──────────→ バブルチャート │ └─ 多変数の相関を一覧 ─────────→ ヒートマップ │ └─【地理】場所による違いを見せたい ├─ 位置を示したい ───────────→ 地図(マーカー) ├─ 地域ごとに色分け ──────────→ コロプレス図 └─ 密度を示したい ───────────→ ヒートマップ(地理)

📝 STEP 3 のまとめ

✅ このステップで学んだこと
メッセージタイプ 主なグラフ ポイント
グラフ選択の原則 「何を伝えたいか」でグラフを選ぶ
比較 棒グラフ、横棒グラフ Y軸は0から、降順に並べる
推移 折れ線グラフ、面グラフ 時系列データに使用、線は5本まで
構成 円グラフ、積み上げ棒グラフ 円グラフより横棒グラフ推奨
分布 ヒストグラム、箱ひげ図 連続データの散らばりを可視化
相関 散布図、バブルチャート 正の相関、負の相関、無相関
地理 地図、コロプレス図 場所による違いを直感的に表現
💡 最重要ポイント

グラフ選択は「データの種類」ではなく「メッセージ」に基づいて行います。

同じデータでも、伝えたいことが違えば、使うべきグラフも変わります。「このデータはどんなストーリーを語っているのか?」「見る人に何を理解してもらいたいのか?」を常に考えましょう。

次のステップでは、グラフをより美しく効果的にする「色彩理論」を学びます!

📝 実践演習

演習 1 基礎

以下の状況に最適なグラフを選んでください。

「5つの商品の今月の売上を比較したい」

【解答】棒グラフ

理由:

  • メッセージタイプは「比較」:どの商品が最も売れているかを比較したい
  • カテゴリ数が5個:棒グラフに適した数(3〜10個が目安)
  • 時系列データではない:折れ線グラフは不適
  • 棒の高さで大小を直感的に比較できる

追加のアドバイス:売上の降順に並べると、どの商品が最も売れているかが一目でわかります。また、最も売れている商品だけ色を変えてハイライトすると、さらに効果的です。

演習 2 応用

以下の2つの状況で、それぞれ適切なグラフを選び、理由を説明してください。

A: 「2020年から2024年までの月別売上の推移を見たい」
B: 「全社員の年齢分布を知りたい」

【解答】

A: 折れ線グラフ

  • メッセージタイプは「推移」:時間とともにどう変化したかを見たい
  • 時系列データ:2020-2024年の月別 = 60ポイント
  • データポイントが多い:棒グラフより折れ線グラフが見やすい
  • トレンドがわかる:上昇・下降・横ばいの傾向が一目でわかる

B: ヒストグラム

  • メッセージタイプは「分布」:データがどう散らばっているかを見たい
  • 連続データ:年齢は連続的な数値データ
  • 度数分布がわかる:どの年齢層に何人いるかが一目でわかる
  • 例:20-29歳、30-39歳、40-49歳…のように区間に分けて表示
演習 3 発展

あなたは経営会議で「当社の主力3商品(A、B、C)の売上構成が、この5年間でどう変化したか」を報告する必要があります。最適なグラフを選び、その理由を説明してください。また、そのグラフで何を強調すべきか提案してください。

【解答】積み上げ面グラフ または 100%積み上げ棒グラフ

理由:

  • メッセージタイプは「構成」+「推移」の複合:構成比がどう変化したかを見せたい
  • 時系列での構成比の変化:円グラフを5つ並べるより見やすい
  • 3商品の相対的な貢献度:各商品のシェアの変化が一目でわかる
  • 全体の売上トレンドも見える(積み上げ面グラフの場合)

強調すべきポイント:

  1. 最も成長した商品を明るい色でハイライト(例:商品Aが成長したなら、Aを目立つ色に)
  2. 構成比が変化した時期に注釈を追加(例:「2022年4月 新商品投入」など)
  3. タイトルで結論を伝える(例:「商品Aのシェアが5年で20%→35%に拡大」)
  4. 各商品の直近の構成比を直接ラベルで表示(例:A: 35%, B: 40%, C: 25%)

補足:100%積み上げ棒グラフは構成比の変化だけに焦点を当てたい場合に、積み上げ面グラフは全体の売上額も同時に見せたい場合に適しています。

❓ よくある質問

Q1: 折れ線グラフと棒グラフ、どちらを使うか迷います。
「時間の流れ」があるかどうかで判断します。月別、四半期別、年別など、時系列データで変化の傾向(トレンド)を見たいなら折れ線グラフ。商品別、店舗別など、順序に意味がないカテゴリデータで大小を比較したいなら棒グラフです。例外として、月別でも「今年の各月を比較したい」(推移ではなく比較)場合は棒グラフを使うこともあります。迷ったら両方作ってみて、より伝わりやすい方を選びましょう。
Q2: 円グラフはあまり使わない方がいいと聞きましたが、本当ですか?
完全に禁止ではありませんが、慎重に使うべきです。円グラフは人間の脳が角度を比較するのが苦手なため、値が近い場合(25%と28%など)に判別が困難です。使用する場合は、カテゴリが3〜5個以内で、1つが50%以上占める場合など、限定的な状況に留めましょう。多くの場合、横棒グラフの方が比較しやすく効果的です。「円グラフでないといけない」場面はほとんどないと考えてください。
Q3: ヒストグラムの「ビン」の数はどう決めればいいですか?
目安は√n(データ数の平方根)ですが、柔軟に調整してください。例えば、データが100個なら√100=10ビンが目安です。ただし、ビンが多すぎると細かくなりすぎてパターンが見えにくく、少なすぎると情報が失われます。実際に試してみて、データの特徴(ピークや分布の形)が見やすい数に調整しましょう。Pythonのmatplotlibやseabornでは、’auto’を指定すると自動で適切な数を計算してくれます。
Q4: 散布図で相関がないように見えますが、データに意味はありますか?
「相関がない」という発見も重要な情報です。例えば、「広告費と売上に相関がない」とわかれば、「広告の効果が出ていない」「別の要因が売上を左右している」という課題が見つかります。また、全体では相関がなくても、データを色分け(商品別、地域別など)すると「商品Aだけ相関がある」といった発見もあります。「何もない」ことを確認するのも、データ分析の大切なプロセスです。
Q5: 1つのグラフに複数のメッセージを込めることはできますか?
可能ですが、1つのグラフに1つのメッセージが原則です。例えば、積み上げ棒グラフは「構成」と「推移」を同時に示せますが、焦点がぼやける危険性もあります。見る人が「結局何を見ればいいの?」と迷ってしまっては本末転倒です。複数のメッセージを伝えたい場合は、グラフを分けるか、ダッシュボードで複数のグラフを並べることを推奨します。「Simple is best」を忘れずに。
📝

学習メモ

データ可視化マスター - Step 3

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE