STEP 28: Power Query入門

🔄 STEP 28: Power Query入門

データ変換の強力なツール!汚いデータを綺麗にしよう

📋 このステップで学ぶこと

  • Power Queryとは何か(役割と必要性)
  • Power Queryエディタの起動方法と画面構成
  • データの読み込みと品質確認
  • 基本的な変換操作(行・列の操作、データ型変更)
  • 適用したステップの管理と編集
  • 変換の保存と自動更新の仕組み

ゴール:Power Queryを使って「汚いデータ」を「分析可能な綺麗なデータ」に変換できるようになる

🎯 1. Power Queryとは

Power Queryの役割を理解しよう

Power Queryは、Power BI に搭載されているデータ整形専用のツールです。実際のビジネスデータは「汚い」ことが多く、そのままでは分析できません。Power Queryを使うことで、データを分析に適した形に変換できます。

✅ Power Query = データ整形のスペシャリスト
機能 説明 具体例
データの読み込み 様々な形式のファイルを取り込む Excel、CSV、データベースなど
データの変換 分析に適した形に整形する 列の削除、名前変更、型変換
データのクリーニング 不要なデータを除去・修正する 空白行削除、重複排除、欠損値処理
データの結合 複数のデータを1つにまとめる 複数シートの統合、テーブル結合

なぜPower Queryが必要なのか

現実のビジネスデータには様々な問題があります。これらの問題を解決しないと、正しい分析ができません。

💡 現実のデータに潜む問題点
問題の種類 具体的な状況 Power Queryでの解決方法
不要な行 ヘッダー行が複数ある、合計行が混在 行の削除機能
不要な列 メモ欄、空白列、計算用の作業列 列の削除機能
データ型の不一致 数値が文字列として格納されている データ型の変更
表記の揺れ 「東京都」「東京」「tokyo」が混在 値の置換機能
欠損値 空白セル、NULL値が含まれる 欠損値の処理
分散データ 複数ファイルにデータが分かれている データの結合・追加
📊 Power Queryの3大メリット
メリット 説明 ビジネスへの効果
再利用可能 一度作った変換手順を何度でも実行できる 作業時間の大幅削減
自動化 データ更新時に自動で変換が適用される 人的ミスの防止
コード不要 GUIで操作、裏でMコードが自動生成 プログラミング知識なしで使える
🔧 Power QueryとExcelの比較
作業内容 Excelで行う場合 Power Queryで行う場合
空白行の削除 手動で1行ずつ削除 ワンクリックで一括削除
データ更新時 同じ作業を最初からやり直し 更新ボタンで自動適用
大量データ 動作が重くなる、クラッシュの可能性 高速に処理可能
元データへの影響 直接編集で元データが変わる 元データは一切変更されない

🚀 2. Power Queryエディタの起動

Power Queryエディタを開く方法

Power Queryエディタは、Power BI Desktop内からアクセスできる専用の編集画面です。起動方法は3つあり、状況に応じて使い分けます。

📊 起動方法1:新しいデータを取得する時
手順 操作 補足
1 ホームタブ→「データを取得」をクリック データソース一覧が表示される
2 データソースを選択(Excel、CSVなど) 使用するファイル形式を選ぶ
3 ファイルを選択→「開く」 目的のファイルを指定
4 ナビゲーター画面で「データの変換」をクリック ⚠️「読み込み」ではなく「データの変換」を選ぶ
5 Power Queryエディタが起動する データ変換の作業画面が開く

重要:「読み込み」を選ぶと変換せずにそのままデータが取り込まれます。データを加工したい場合は必ず「データの変換」を選んでください。

✅ 起動方法2:既存のクエリを編集する時
手順 操作 補足
1 ホームタブ→「データの変換」ボタンをクリック すべてのクエリが表示される
2 Power Queryエディタが起動 左側のクエリ一覧から編集対象を選択
📊 起動方法3:特定のクエリだけを編集する時
手順 操作 補足
1 右側の「フィールド」ペインでテーブル名を右クリック 編集したいデータを選ぶ
2 「クエリの編集」を選択 そのクエリだけが表示された状態で起動

Power Queryエディタの画面構成

Power Queryエディタは5つのエリアで構成されています。それぞれの役割を理解しておくと、作業がスムーズになります。

💡 Power Queryエディタの画面構成
エリア 位置 役割と説明
リボンメニュー 上部 変換操作のボタンが並ぶ。「ホーム」「変換」「列の追加」などのタブがある
クエリペイン 左サイドバー 作成したクエリ(データソース)の一覧。クリックで切り替え
データプレビュー 中央 データの内容を表示。最初の200行のみ表示(全データではない)
適用したステップ 右サイドバー 変換操作の履歴。すべての操作が記録される
ステータスバー 下部 データの行数・列数を表示
📊 データプレビューの重要な注意点
項目 説明
表示されるのは200行まで パフォーマンスのため、プレビューは最初の200行のみ。実際のデータはすべて処理される
列ヘッダーにデータ型表示 列名の左側にアイコンが表示される。ABC=テキスト、123=数値、📅=日付
スクロールでデータ確認 上下左右にスクロールしてデータの内容を確認できる

📋 3. データの読み込みと確認

Excelファイルを読み込んでみよう

まずは最も一般的なExcelファイルの読み込みから始めましょう。読み込んだ後は、データの品質を確認することが重要です。

📊 Excelファイル読み込みの詳細手順
手順 操作 ポイント
1 ホームタブ→「データを取得」→「Excel」 ファイル選択ダイアログが開く
2 目的のExcelファイルを選択→「開く」 ファイルのパスを確認しておく
3 ナビゲーター画面でシート/テーブルを選択 左側にシート一覧、右側にプレビューが表示
4 プレビューでデータを確認 意図したデータか確認する
5 「データの変換」ボタンをクリック Power Queryエディタが開く

データ品質の確認方法

データを読み込んだら、まずデータの品質を確認しましょう。問題のあるデータを早期に発見することで、後の分析でのトラブルを防げます。

✅ データ品質確認の手順
確認項目 確認方法 確認すべきこと
行数・列数 下部のステータスバーを確認 想定どおりの件数か?
列名 列ヘッダーを確認 正しい列名になっているか?
データ型 列ヘッダー左側のアイコン 数値は数値型、日付は日付型になっているか?
列の品質 表示タブ→「列の品質」をON エラーや空白の割合は?
列の分布 表示タブ→「列の分布」をON 値の分布は正常か?
📊 列の品質で表示される情報
表示項目 意味 対処方法
有効(緑) 正常なデータの割合 100%が理想
エラー(赤) エラーを含むセルの割合 データ型の変更、エラー行の削除
空(灰) 空白セルの割合 空白行の削除、値の置換

設定方法:表示タブ→「列の品質」チェックボックスをONにすると、各列のヘッダー下にバーが表示されます。

💡 データ型のアイコン一覧
アイコン データ型 説明
ABC テキスト 文字列データ(名前、住所など)
123 整数 小数点なしの数値(個数、IDなど)
1.2 10進数 小数点ありの数値(金額、割合など)
📅 日付 日付データ(YYYY/MM/DD形式など)
🕐 日付/時刻 日付と時刻の両方を含むデータ
True/False 論理値 真偽値(はい/いいえ、ON/OFF)

⚙️ 4. 基本的な変換操作

不要な行を削除する

データの先頭や末尾に、分析に不要な行が含まれていることがあります。Power Queryでは様々な方法で行を削除できます。

📊 行の削除操作一覧
削除の種類 使用場面 操作手順
上位の行の削除 先頭に不要なヘッダー行がある場合 ホーム→行の削除→上位の行の削除→行数を入力
下位の行の削除 末尾に合計行やメモがある場合 ホーム→行の削除→下位の行の削除→行数を入力
空白行の削除 空の行が混在している場合 ホーム→行の削除→空白行の削除
重複行の削除 同じデータが重複している場合 列を選択→ホーム→行の削除→重複の削除
エラー行の削除 エラーを含む行を除外したい場合 列を選択→ホーム→行の削除→エラーの削除
✅ 「上位の行の削除」の詳細手順
手順 操作 補足
1 ホームタブをクリック リボンの「ホーム」タブを選択
2 「行の削除」ボタンをクリック ドロップダウンメニューが表示される
3 「上位の行の削除」を選択 ダイアログが開く
4 削除したい行数を入力(例:2) 先頭から指定した行数が削除される
5 「OK」をクリック 「適用したステップ」に記録される

不要な列を削除する

分析に使わない列は削除しておくと、データがすっきりして作業しやすくなります。また、データ量も減るためパフォーマンスも向上します。

📊 列の削除操作一覧
削除方法 使用場面 操作手順
列の削除 特定の1〜数列を削除したい場合 列を選択→右クリック→「削除」
他の列の削除 残したい列だけを選んで他を削除 残す列を選択→右クリック→「他の列の削除」
💡 複数列の選択方法
選択方法 キー操作 説明
複数の離れた列 Ctrlキー + クリック Ctrlを押しながら列をクリック
連続した列 Shiftキー + クリック 最初と最後の列をShift+クリック
すべての列 Ctrl + A すべての列を選択

列名を変更する

わかりやすい列名にしておくと、後の分析作業がスムーズになります。レポートを見る人にも理解しやすくなります。

📊 列名の変更方法
方法 操作手順 特徴
ダブルクリック 列ヘッダーをダブルクリック→新しい名前を入力→Enter 最も素早い方法
右クリック 列ヘッダーを右クリック→「名前の変更」→新しい名前を入力 メニューから選ぶ方法
✅ 列名のベストプラクティス
推奨度 ルール 具体例
✅ 推奨 日本語で意味がわかる名前 「売上金額」「顧客名」「注文日」
✅ 推奨 簡潔で具体的な名前 「売上」より「月間売上」
⚠️ 注意 スペースは使える(ただし避けた方が無難) 「売上 金額」より「売上金額」
❌ 避ける 特殊記号は使わない 「売上@金額」「売上#1」は避ける
❌ 避ける 略語だけの名前は避ける 「URG」より「売上金額」

データ型を変更する

データ型が正しくないと、集計やフィルターが正常に動作しません。特に数値や日付のデータは、適切なデータ型に変更することが重要です。

🔧 データ型が正しくないと起こる問題
問題 原因 症状
集計ができない 数値がテキスト型になっている SUM関数が使えない、グラフに表示できない
フィルターがおかしい 数値がテキスト型になっている 「1」「10」「2」の順で並ぶ(文字列ソート)
日付計算ができない 日付がテキスト型になっている 年月日でのフィルターができない
ビジュアルが作れない データ型の不一致 軸に使えない、エラーが表示される
📊 データ型の変更手順
手順 操作 補足
1 変更したい列のヘッダー左側のアイコンをクリック データ型のリストが表示される
2 適切なデータ型を選択 テキスト、整数、10進数、日付など
3 「現在のものを置換」を選択 自動検出された型を上書きする

ヒント:Power Queryは自動でデータ型を推測しますが、必ずしも正しくありません。特に数値や日付は必ず確認しましょう。

📊 よく使うデータ型の選び方
データの内容 推奨データ型 具体例
名前、住所 テキスト 田中太郎、東京都渋谷区
個数、ID 整数 100個、ID:12345
金額、割合 10進数 1,234.56円、85.5%
日付 日付 2024/01/15
日時 日付/時刻 2024/01/15 14:30:00

📝 5. 適用したステップの管理

「適用したステップ」とは

Power Queryの最大の特徴は、すべての操作が「ステップ」として記録されることです。これにより、変換の履歴を確認したり、途中の操作を修正したりできます。

✅ ステップの仕組みを理解しよう
特徴 説明
すべての操作が記録される 行の削除、列名変更、データ型変更など、あらゆる操作がステップとして記録される
順序が重要 ステップは上から順に実行される。順序を変えると結果が変わる場合がある
クリックで時点を確認 各ステップをクリックすると、その時点でのデータプレビューが表示される
再実行可能 データ更新時に、すべてのステップが自動で再実行される
📊 よく見かけるステップ名
ステップ名 実行された操作 自動生成されるタイミング
ソース データの読み込み元を指定 データ取得時(自動)
昇格されたヘッダー 1行目を列名として使用 データ取得時(自動)
変更された型 データ型の自動検出・変更 データ取得時(自動)
削除された列 列の削除 列削除時
削除された上位の行 先頭行の削除 行削除時
名前が変更された列 列名の変更 列名変更時

ステップの操作方法

ステップは後から確認、削除、編集することができます。間違えた操作を取り消したり、設定を変更したりできます。

📊 ステップの基本操作
操作 方法 注意点
ステップの確認 ステップ名をクリック その時点のデータが表示される
ステップの削除 ステップ名の左側の×をクリック 後続のステップに影響する場合あり
ステップの編集 ステップ名の右側の⚙をクリック 設定ダイアログが開く
ステップ名の変更 ステップ名を右クリック→名前の変更 わかりやすい名前に変更推奨
元に戻す Ctrl + Z 直前の操作を取り消し
🔧 ステップ削除時の注意点
状況 説明
後続ステップへの影響 途中のステップを削除すると、それ以降のステップがエラーになる可能性がある
列名変更後の削除 列名変更ステップを削除すると、その列名を使っている後続ステップがエラーになる
確認ダイアログ 削除時に確認メッセージが表示される。「削除」を選ぶと確定

対処法:エラーが出た場合は、Ctrl + Z で元に戻すか、エラーになったステップを再作成してください。

💡 ステップ名をわかりやすく変更しよう
デフォルトの名前 変更後の例 メリット
削除された列 メモ列を削除 何を削除したか明確
変更された型 売上を数値型に変換 どの列を変更したか明確
削除された上位の行 ヘッダー2行を削除 何行削除したか明確

変更方法:ステップ名を右クリック→「名前の変更」→新しい名前を入力→Enter

💾 6. 変換の保存と読み込み

変換を完了してPower BIに反映する

Power Queryエディタでの変換作業が終わったら、「閉じて適用」でPower BI Desktopに反映させます。この操作で初めて、実際にすべてのデータに変換が適用されます。

📊 変換を反映する方法
ボタン 動作 使用場面
閉じて適用 変換を実行してエディタを閉じる 作業完了時
適用 変換を実行(エディタは開いたまま) 途中で結果を確認したい時
閉じる 変換を保留してエディタを閉じる 後で続きを作業したい時
✅ 「閉じて適用」の詳細手順
手順 操作 補足
1 ホームタブ→「閉じて適用」ボタンをクリック リボン左端にある大きなボタン
2 変換処理が実行される 進捗バーが表示される
3 Power BI Desktopに戻る 変換後のデータが利用可能に
4 データビューで結果を確認 変換が正しく適用されているか確認

データの更新と自動変換

Power Queryの最大の強みは、元データが更新された時に、設定した変換が自動で再適用されることです。毎回手作業で変換する必要がありません。

📊 データ更新の仕組み
手順 内容 自動で行われること
1 元データ(Excel/CSV)を更新 Power BIとは別で元ファイルを更新
2 Power BIで「更新」ボタンをクリック 最新データの読み込みが開始
3 Power Queryの変換が自動実行 すべてのステップが再実行される
4 レポートが最新データで更新される グラフや表が新しいデータを反映
💡 データ更新の方法
方法 操作 特徴
方法1 ホームタブ→「更新」ボタン 最も一般的な方法
方法2 F5キーを押す ショートカットで素早く更新
方法3 フィールドペインでテーブルを右クリック→「更新」 特定のテーブルのみ更新

クエリの複製と参照

同じような変換を別のデータにも適用したい場合、クエリを複製または参照することで効率的に作業できます。

📊 複製と参照の違い
操作 特徴 使用場面
複製 完全に独立したコピーを作成。元を変更しても影響なし 同じ変換を別のデータに適用したい
参照 元のクエリの結果を使用。元を変更すると影響を受ける 変換結果をさらに加工したい
✅ クエリの複製・参照の手順
手順 複製の場合 参照の場合
1 左側のクエリペインでクエリを右クリック 左側のクエリペインでクエリを右クリック
2 「複製」を選択 「参照」を選択
3 「クエリ名 (2)」として作成される 新しいクエリとして作成される
4 独立して編集可能 元のクエリの結果から続けて変換

🎨 7. Power Queryのベストプラクティス

変換の推奨順序

変換操作には推奨される順序があります。この順序で行うことで、効率的かつ正確にデータを整形できます。

✅ 推奨される変換の順序
順序 操作 理由 具体例
1 不要な行の削除 データ量を減らす ヘッダー行、空白行
2 不要な列の削除 処理を軽くする メモ列、作業列
3 データ型の変更 正しい型に設定 数値、日付
4 列名の変更 わかりやすい名前に 日本語の名前
5 値の置換 表記の統一 「東京」「tokyo」→「東京都」
6 列の分割・結合 必要な形に整形 姓名の分割
7 フィルター 必要なデータに絞る 特定期間のみ
8 並べ替え 最後に実施 日付順、名前順

パフォーマンスを意識した変換

大量のデータを扱う場合、変換の仕方によって処理速度が大きく変わります。以下のポイントを意識しましょう。

💡 高速化のコツ
ポイント 理由 効果
早い段階で行数を減らす 処理対象のデータ量が減る 後続の処理が高速化
不要な列は早めに削除 メモリ使用量が減る ファイルサイズも削減
データ型変更は1回で 複数回変更は非効率 ステップ数の削減
並べ替えは最小限に 並べ替え処理は重い 処理時間の短縮
ステップを増やしすぎない 各ステップに処理コストがかかる 全体の処理時間短縮

エラーへの対処方法

データ変換中にエラーが発生することがあります。エラーの種類を理解し、適切に対処しましょう。

🔧 よくあるエラーと対処法
エラーの種類 原因 対処法
DataFormat.Error データ型の変換に失敗 元データを確認、適切な型を選択
Expression.Error 式や計算のエラー 計算式を確認、NULLチェック追加
DataSource.Error データソースにアクセスできない ファイルパスを確認、接続設定を確認
列が見つからない 列名が変更された/削除された 元データの列名を確認
📊 エラー確認と処理の手順
手順 操作 目的
1 表示タブ→「列の品質」をON エラーの割合を確認
2 列ヘッダーのフィルター→「エラー」を選択 エラー行のみを表示
3 エラーセルをクリック エラーの詳細を確認
4 原因に応じた対処を実施 データ型変更、値の置換、行の削除など

📝 STEP 28 のまとめ

✅ このステップで学んだこと
  • Power Query: データ整形の専用ツール。汚いデータを綺麗にする
  • 起動方法: 「データの変換」ボタンから起動
  • 基本操作: 行・列の削除、列名変更、データ型変更
  • ステップ: すべての操作が履歴として自動記録される
  • 閉じて適用: 変換を実行してPower BIに反映
  • 自動更新: 元データ変更時も設定した変換が自動で再適用
💡 最重要ポイント

Power Queryはデータ分析の成否を決める重要なツールです。

「汚いデータ」を「綺麗なデータ」に変換することで、その後の分析がスムーズになります。

一度設定すれば、データ更新時に自動で変換が適用されるのが最大の強み。

時間をかけて丁寧にデータを整形しましょう!

📝 実践演習

演習 1 基礎

Excelファイルを読み込み、Power Queryエディタを起動してください。不要な列を1つ削除し、「適用したステップ」で削除が記録されていることを確認してください。

【手順】
1 ホームタブ→「データを取得」→「Excel」
2 Excelファイルを選択→「開く」
3 ナビゲーターでシートを選択
4 「データの変換」をクリック(重要!)
5 不要な列のヘッダーを右クリック→「削除」
6 右サイドバーの「適用したステップ」を確認

💡 確認ポイント:

  • 「削除された列」というステップが追加されている
  • ステップをクリックすると、その時点のデータが表示される
  • ×をクリックするとステップを削除できる
演習 2 応用

以下の変換を順番に実行してください:①先頭の2行を削除、②「ID」列以外の列の名前をわかりやすく変更、③数値の列のデータ型を「整数」に変更。最後に「閉じて適用」でPower BIに反映してください。

【手順】

①先頭の2行を削除:

1 ホームタブ→「行の削除」→「上位の行の削除」
2 「2」を入力→「OK」

②列名の変更:

1 変更したい列ヘッダーをダブルクリック
2 新しい名前を入力(例:「売上金額」)→Enter
3 他の列も同様に変更

③データ型の変更:

1 数値列のヘッダー左側のアイコンをクリック
2 「整数」を選択

④反映:

1 ホームタブ→「閉じて適用」
2 Power BI Desktopに戻り、データビューで確認
演習 3 発展

複数の変換を行った後、1つのステップを削除してデータがどう変わるか確認してください。その後、削除したステップを再作成してください。

【ステップ1:複数の変換を実施】
  • 列の削除
  • 列名の変更
  • データ型の変更
  • 行の削除
【ステップ2:ステップの削除】
1 右サイドバーの「適用したステップ」から中間のステップを選ぶ
2 ステップ名の左側の×をクリック
3 確認メッセージ→「削除」
4 データプレビューの変化を確認
【ステップ3:影響の確認】
  • 列名変更ステップを削除した場合→列名が元に戻る
  • 後続のステップでエラーが出る可能性あり(!マークが表示)
【ステップ4:ステップの再作成】
1 削除したステップの直前のステップをクリック
2 削除した操作を再度実行
3 新しいステップが追加される

💡 学習ポイント:

  • ステップは順序が重要
  • 途中のステップを削除すると後続に影響
  • Ctrl+Zで元に戻せる

❓ よくある質問

Q1: Power Queryでの変換は元データに影響しますか?
いいえ、元データは一切変更されません。

Power Queryはデータを読み込んで変換しますが、元のExcelやCSVファイルは変更されません。変換結果はPower BIの内部データモデルに保存されます。

これにより、安心してデータを加工でき、必要に応じて元データを確認することもできます。
Q2: データプレビューに全データが表示されないのはなぜですか?
パフォーマンスのため、最初の200行のみ表示されます。

これはあくまでプレビューであり、実際には全データが処理されています。「閉じて適用」を実行すると、すべてのデータに変換が適用されます。

画面下部のステータスバーで、実際のデータ件数を確認できます。
Q3: ステップを間違えて削除してしまいました。元に戻せますか?
Ctrl + Z で元に戻せます。

通常の操作と同じように、取り消し機能が使えます。複数回押せば、複数の操作を取り消すこともできます。

また、もう一度同じ操作を実行すれば、新しいステップとして追加されます。
Q4: Power Queryとデータビューの違いは何ですか?
Power Queryはデータ変換用、データビューは確認用です。

項目 Power Query データビュー
目的 データを整形・変換する 変換後のデータを確認する
履歴 すべての操作が記録される 履歴は残らない
機能 高度な変換が可能 閲覧と簡単な編集のみ

データの整形は必ずPower Queryで行いましょう。

Q5: 「読み込み」と「データの変換」の違いは何ですか?
「読み込み」はそのまま取り込み、「データの変換」は加工してから取り込みます。

ボタン 動作
読み込み データをそのままPower BIに取り込む。後からPower Queryで編集は可能
データの変換 Power Queryエディタが開き、変換してから取り込む

データを加工する必要がある場合は、「データの変換」を選ぶのがおすすめです。

Q6: データ型を変更したらエラーが出ました。どうすればいいですか?
元データに変換できない値が含まれている可能性があります。

例えば、数値に変換しようとした列に「N/A」や「-」などの文字が含まれていると、エラーになります。

対処法:
  1. 列の品質を表示してエラーの割合を確認
  2. エラー行のみをフィルターして内容を確認
  3. エラーを含む値を「値の置換」で修正
  4. または、エラー行を削除
Q7: 変換処理が遅いのですが、どうすれば高速化できますか?
以下のポイントを確認してください:

  • 不要な列を早めに削除:処理するデータ量が減ります
  • フィルターを早めに適用:行数を減らすと後続の処理が高速化
  • ステップ数を最小限に:必要以上に細かくステップを分けない
  • 並べ替えは最後に:並べ替え処理は負荷が高い
📝

学習メモ

BIツール入門 - Step 28

📋 過去のメモ一覧
#artnasekai #学習メモ
LINE