SQL DISTINCTで複数列を指定してカウントするときの注意点

SQL 重複した値を除いた件数をカウントするで、重複したデータを１件として集計する方法を紹介しましたが、重複の判定に複数の列をしている場合は注意が必要です。

複数の列で重複の判定を行うときは、以下のように対象の列を文字列結合することが多いです。

employee（社員）
id	first_name	last_name
1	一郎	山田
2	次郎	山田
3	三郎	田中
4	一郎	山田

SELECT
  COUNT(DISTINCT last_name || first_name) --3
FROM
  employee

上記のSQLだと、以下のデータも「山田一郎」の重複データとして扱われてしまいます。

employee（社員）
id	first_name	last_name
1	一郎	山田
2	次郎	山田
3	三郎	田中
4	一郎	山田
5	田一郎	山

SELECT
  COUNT(DISTINCT last_name || first_name) --3
FROM
  employee

単独のカラムでは値がことなるのに、文字列結合した場合は値が同じになるケースを考慮する必要があります。

以下のように区切り文字を指定して対処する必要があります。

SELECT
  COUNT(DISTINCT last_name || '_' || first_name)
FROM
  employee

古い記事
SQL 重複した値を除いた件数をカウントする

新しい記事
SQL 指定した条件にマッチする行のみカウントする

VSCodeからSQL Serverに接続してSQLを実行する
VSCodeからSQL Serverに接続してSQLを実行する方法を紹介します。SQL ServerをDockerで起動して別コンテナからアクセスするで、VSCodeからDockerで起動したSQL ...
SQL ServerをDockerで起動して別コンテナからアクセスする
SQL ServerをDockerで起動して別コンテナからアクセスする方法を紹介します。SQL Serverへの接続はVSCodeで行います。ASP.NET（.NET Core）の開発環境をDocke...
SQL WITH句で同じSQLを１つのSQLに共通化する
SQL SELECT句での副問合せの基本的な考え方と注意点で紹介したように、副問合せを使用していると同じようなSQLを複数箇所で行うことがあります。同じようなSQLはWITH句を使用して共通化すればパ...
SQL 重複しているレコードを一括でUPDATEする
ある列の値が同じレコードが複数ある場合に、そのレコードを全てUPDATEする方法を紹介します。重複しているレコードを１行に集約する方法などはよく見かけますが、重複するレコードを一括でUPDATEします...
SQL テーブルと列（カラム）にコメントを設定する方法
SQLでテーブルと列（カラム）にコメントを設定する方法を紹介します。SQL CREATE文でテーブルを新規作成するで紹介した方法で、テーブルを作成する際に、一緒にコメントを論理名として登録することが多...
SQL SELECT句での副問合せの基本的な考え方と注意点
SELECT句での副問合せをうまく利用すれば、集計単位の異なる値を同時に取得できます。以下のようなテーブルがあるとします。SQL GROUP BYで複数の行を集計して１行で取得するで紹介したように、 ...
SQL SELECT句でテーブルから指定した列のデータを取得する
SELECT句はFROM句で指定されたテーブルから、どの列を取得するかを指定するための構文です。（FROM句についてはでSQL FROM句で複数のテーブルを結合するポイント紹介しています。）以下のよう...
SQL 別テーブルをSELECTした結果が存在すればその値を使用してUPDATEする方法
SQL 別テーブルをSELECTした結果をそのままINSERTする方法でSELECTした結果をそのままINSERTする方法を紹介しましたが、同じようにSELECTした結果がすでに存在していればその値で...
SQL UPDATE文で副問い合わせで取得した値を複数列に設定する方法
UPDATE文で、副問い合わせで取得した値を複数列に設定する方法を紹介します。SETで指定する列を()で囲い、副問い合わせのSQLで()で囲った列に対応するようにSELECTで取得します。SELECT...
SQL 別テーブルをSELECTした結果をそのままINSERTする方法
あるテーブル（A）に登録されているデータを利用して別のテーブル（B）にデータを登録したい場合があります。AをSELECTして、取得したデータを１件ごとBにINSERTするのではなく、AをSELECTし...