🧹 Step 31: 重複の削除と空白セルの処理
データをクリーンアップして品質を向上させよう!
📋 このステップで学ぶこと
- データクレンジングの基本概念と重要性
- 条件付き書式で重複データを検出する方法
- 重複の削除機能の使い方と注意点
- 空白セルの検索と3つの処理方法
- 実務での活用例とよくある間違い
🎯 1. データクレンジングとは
データクレンジングとは、データの誤りや不要な情報を取り除き、データの品質を高める作業です。重複データや空白セルがあると、正確な分析ができません。
「汚れたデータをきれいにする」作業です。洗濯物を洗濯するように、データも「洗う」ことで使いやすくなります。
| 名前 | 部署 | 売上高 |
| 田中 | 営業 | 1500 |
| 田中 | 営業 | 1500 |
| 佐藤 | 1200 | |
| 鈴木 | 営業 |
- 🔄 重複データ(田中が2回)
- ⚪ 空白セル(部署・売上高)
- 📊 合計が不正確になる
- 🔍 検索・分析が困難
| 名前 | 部署 | 売上高 |
| 田中 | 営業 | 1500 |
| 佐藤 | 開発 | 1200 |
| 鈴木 | 営業 | 2000 |
- ✓ 重複が削除された
- ✓ 空白が補完された
- ✓ 正確な集計が可能
- ✓ 分析しやすいデータ
名簿を整理するときを想像してください。同じ人が2回登録されていたり、住所が空欄だったりすると困りますよね。データクレンジングは、そうした不備を見つけて修正する作業です。
📝 2. 重複データの検出
まず、データに重複があるかどうかを視覚的に確認します。条件付き書式を使うと、重複しているセルを自動で色付けできます。
1. データ範囲を選択
2. ホームタブ → 条件付き書式
3. セルの強調表示ルール → 重複する値
4. 書式を選択(デフォルトは薄い赤の塗りつぶし)
5. OK
→ 重複しているセルが色付けされる
| 商品コード | 商品名 | 価格 |
| A001 | ノートPC | 80000 |
| A001 | ノートPC | 80000 |
| A002 | デスクトップ | 60000 |
| A001 | ノートPC | 80000 |
いきなり削除するのではなく、まず「どこに重複があるか」を目で確認できます。意図しないデータを削除してしまうリスクを減らせます。
📝 3. 重複の削除
重複データを自動的に削除する機能です。最初に見つかった行が残り、それ以降の重複行が削除されます。
1. データ範囲を選択(ヘッダー含む)
2. データタブ → 重複の削除
3. 重複チェックに使用する列を選択(通常は全列を選択)
4. 「先頭行をデータの見出しとして使用する」にチェック
5. OK
→ 重複行が削除され、何件削除されたか表示される
| 名前 | メール |
| 田中太郎 | tanaka@example.com |
| 田中太郎 | tanaka@example.com |
| 佐藤花子 | sato@example.com |
| 田中太郎 | tanaka@example.com |
| 鈴木一郎 | suzuki@example.com |
| 名前 | メール |
| 田中太郎 | tanaka@example.com |
| 佐藤花子 | sato@example.com |
| 鈴木一郎 | suzuki@example.com |
重複の削除は元に戻せません(Ctrl+Zで戻せるのは直後のみ)。実行前に必ずデータのバックアップを取るか、別のシートにコピーしてから作業してください。最初に見つかった行が残り、それ以降の重複行が削除されます。
📝 4. 特定列だけで重複判定
全ての列ではなく、特定の列だけで重複判定することもできます。例えば「メールアドレスが同じなら重複」と判定したい場合に使います。
📝 特定列での重複判定の例(※横スクロールできます)
全列を選択:完全に同じ行だけを削除
特定列を選択:その列の値が同じなら削除(他の列が違っても)
どちらを使うかは、データの性質と目的によって決めましょう。
📝 5. 空白セルの検索
データに空白セルがあるかどうかを見つける方法です。「条件を選択してジャンプ」機能を使います。
1. データ範囲を選択
2. ホームタブ → 検索と選択 → 条件を選択してジャンプ
3. 空白セルを選択
4. OK
→ 空白セルがすべて選択される
| 名前 | 部署 | 電話番号 |
| 田中 | 営業 | 03-1234-5678 |
| 佐藤 | 03-2345-6789 | |
| 鈴木 | 開発 | |
| 伊藤 | 総務 | 03-3456-7890 |
Ctrl + G → 「セル選択」→「空白セル」でも同じ操作ができます。
Googleスプレッドシートでは、フィルター機能を使って空白セルを表示します。
📝 6. 空白セルの処理方法
見つけた空白セルを処理する3つの方法を学びます。状況に応じて使い分けましょう。
2. 「不明」または「0」などと入力
3. Ctrl + Enter で一括入力
2. =(イコール)を入力
3. 上のセルを参照(例:=A1)
4. Ctrl + Enter
2. 該当列の▼ → 空白のみ表示
3. 表示された行を選択して削除
4. フィルターを解除
📝 実例:部署の空白を「未配属」で埋める(※横スクロールできます)
通常のEnterは1つのセルにしか入力できませんが、Ctrl + Enterを使うと、選択中のすべてのセルに同じ値を一括入力できます。100個の空白セルも一瞬で埋められます!
📝 7. 実務での活用例
データクレンジングは、さまざまなビジネスシーンで活用されています。
対応:メールアドレス列で重複削除
効果:同じ人に複数回メールが送られるのを防止
対応:商品コード列で重複削除
効果:在庫管理が正確になる
対応:顧客ID列で重複削除
効果:正確な顧客数を把握できる
対応:空白セルを検索して手動で確認・入力
効果:正確な売上分析が可能
⚠️ 8. よくある間違いと注意点
📝 よくある間違い(※横スクロールできます)
重複削除や行削除は元に戻せません(直後のCtrl+Zを除く)。特に重要なデータの場合は、まず別のシートにコピーしてから作業するか、削除前にファイル全体をバックアップしてください。
空白(データなし):まだ入力されていない、情報がない
0(ゼロ):数値として「0」という値がある
例えば売上データで「空白」は「未記録」、「0」は「売上なし」を意味します。状況に応じて適切な値を選びましょう。
📝 練習問題
条件付き書式を使って重複データを赤色で強調表示してください
📝 表(※横スクロールできます)
操作手順:
- A2:A6を選択
- ホームタブ → 条件付き書式
- セルの強調表示ルール → 重複する値
- 書式を選択(デフォルトの赤)
- OK
結果:
A001とA002が赤く表示されます(それぞれ2回ずつ登場するため)。A003は1回だけなので色がつきません。
メールアドレス列だけで重複を判定して削除してください
📝 表(※横スクロールできます)
操作手順:
- A1:B4を選択
- データタブ → 重複の削除
- 「先頭行をデータの見出しとして使用する」にチェック
- 「メール」列だけにチェックを入れる(「名前」のチェックを外す)
- OK
結果:
解説:
行3(佐藤)が削除されます。メールアドレスが田中と同じため、重複と判定されました。名前が違っても、メール列だけで判定しているので削除されます。
部署列の空白セルをすべて「未配属」で埋めてください
📝 表(※横スクロールできます)
操作手順:
- B2:B5を選択
- ホームタブ → 検索と選択 → 条件を選択してジャンプ
- 空白セルを選択 → OK
- 「未配属」と入力
- Ctrl + Enter
結果:
解説:
B3とB5の空白セルに「未配属」が一括入力されました。Ctrl + Enterで選択中のすべてのセルに同じ値を入力できます。
空白セルに上のセルと同じ値を入力してください
📝 表(※横スクロールできます)
操作手順:
- A2:A6を選択
- ホームタブ → 検索と選択 → 条件を選択してジャンプ
- 空白セルを選択 → OK
- 「=A2」と入力(最初の空白セルA3に対して、上のセルA2を参照)
- Ctrl + Enter
結果:
解説:
各空白セルに上のセルの値がコピーされました。これは「空白を上のセルの値で埋める」典型的なパターンです。データが結合されていたり、カテゴリごとに一度だけ値が入力されている場合に便利です。
重複を検出して削除し、さらに空白セルを「N/A」で埋めてください
📝 表(※横スクロールできます)
操作手順:
Step 1:重複の削除
- A1:C5を選択
- データタブ → 重複の削除
- すべての列にチェック → OK
Step 2:空白セルの処理
- A2:C4を選択(データ部分のみ)
- ホームタブ → 検索と選択 → 条件を選択してジャンプ
- 空白セルを選択 → OK
- 「N/A」と入力
- Ctrl + Enter
結果:
解説:
まず重複(行4)が削除され、次に空白セル(佐藤の電話番号)に「N/A」が入力されました。この順序で作業することで、クリーンなデータが完成します。
📝 Step 31 のまとめ
✅ このステップで学んだこと
重複の削除と空白セルの処理をマスターしました!次のStep 32では、VLOOKUPの基本構文を学びます。実務で最も使われる重要な関数を習得します。
❓ よくある質問
=IF(A1="","",A1)のように数式が入っている場合、見た目は空白でも「空白セル」ではありません。このような場合は、まず値貼り付けで数式を値に変換してから検索する必要があります。
=COUNTIF(A:A, A2)で、A2の値がA列に何回出現するかカウントできます。2以上なら重複していることがわかります。
学習メモ
Excel・Googleスプレッドシート完全マスター - Step 31