SQL ある列の値が最大もしくは最小の値のレコードを取得する
例えば以下のテーブルがあるとき、身長が一番大きい社員のレコードを取得したい場合があります。
| id | first_name | last_name | department_id | height |
|---|---|---|---|---|
| 1 | 一郎 | 山田 | 1 | 170 |
| 2 | 次郎 | 佐藤 | 2 | 175 |
| 3 | 三郎 | 田中 | 1 | 185 |
| 4 | 四郎 | 鈴木 | 2 | 155 |
業務でもよくありがちな仕様ですが、一見簡単そうで難しい問題です。
一番簡単な方法としては、単純にORDER BYで身長順に並び替えて取得したあと、1行目を見れば身長が最大のレコードということになります。
SELECT *
FROM employee
ORDER BY height DESCしかしこの方法では2行目以降も取得してしまいますので、副問い合わせなどで対象のレコードのみ取得したい場合は別の方法で取得する必要があります。
分析関数を使う方法
SQL PARTITION BYの基本と効率的に集計する便利な方法で紹介した分析関数を使えば以下のように取得できます。
SELECT
last_name,
height
FROM (
SELECT
last_name,
height,
ROW_NUMBER() OVER(ORDER BY height DESC) height_order
FROM
employee
)
WHERE
height_order = 1| last_name | height |
|---|---|
| 田中 | 185 |
解説
副問い合わせの部分のみ取得した結果を確認します。
| last_name | height | height_order |
|---|---|---|
| 山田 | 170 | 3 |
| 佐藤 | 175 | 2 |
| 田中 | 185 | 1 |
| 鈴木 | 155 | 4 |
height_orderは身長の降順に並び替えたときの行番号です。
行番号が1のレコードが、身長が最大ということになるので、取得した結果をheight_order = 1で絞り込みます。
応用
上記例では全社員で身長が最大の社員を取得しましたが、部署(department_id)ごとに身長が最大の社員を取得したい場合があります。
PARTITION BYでdepartment_idを指定すれば、行番号の集計単位が部署ごとになるので、部署での取得も簡単にできるようになります。
SELECT
last_name,
height
FROM (
SELECT
last_name,
height,
ROW_NUMBER() OVER(PARTITION BY department_id ORDER BY height DESC) height_order
FROM
employee
)
WHERE
height_order = 1| last_name | height |
|---|---|
| 佐藤 | 175 |
| 田中 | 185 |
| last_name | height | height_order |
|---|---|---|
| 山田 | 170 | 2 |
| 佐藤 | 175 | 1 |
| 田中 | 185 | 1 |
| 鈴木 | 155 | 2 |