SQL GROUP BYで複数の行を集計して１行で取得する

SQLでデータを取得するときに、複数行のデータを集計してデータの合計、平均、件数、最大値などを取得したい場合があります。

以下のようなテーブルがあるとします。

employee（社員）
id	first_name	last_name	department_id	height
1	一郎	山田	1	170
2	次郎	佐藤	2	175
3	三郎	田中	1	185
4	四郎	鈴木	2	155

部署ごと(department_idごと) の平均身長、最大身長を取得したいときは以下のようなSQLになります。

SELECT
  department_id,
  AVG(height) AS avg_height,
  MAX(height) AS max_height
FROM
  employee
GROUP BY
  department_id

取得結果
department_id	avg_height	max_height
1	177.5	185
2	165	175

部署ごとのデータなので、同一のdepartment_idのデータは１行に集約して表示する必要があります。

GROUP BY 列名で集約したい列を指定します。上記例の場合はdepartment_idごとに集約したいのでdepartment_idを指定しています。

集計関数

GROUP BYで指定した列以外の列をSELECT句で取得したい場合は、集計関数で集計する必要があります。

なぜなら、以下の２つのデータはdepartment_idが同じなので１行に集約する必要があるわけですが、department_id以外の列の値は何を出力すればいいのかわからないからです。

GROUP BYで指定した列は同じ値のデータが集約される（集約されるデータの値はすべて同じ）ので、集計関数で集計する必要はありません。

employee
id	first_name	last_name	department_id	height
1	一郎	山田	1	170
3	三郎	田中	1	185

集約結果
id	first_name	last_name	department_id	height
?	?	?	1	?

集約されるデータの中での最大のデータを取得したい場合はMAX(列名)を指定します。

同じように、最小値はMIN、平均値はAVG、件数はCOUNTを使用します。

上記例では平均値と最大値を取得したいので、AVGとMAXを使用しています。

集計関数で取得した列名は別名を使用する

SELECT句で集計関数で取得する項目に別名を指定していないと取得した結果に対してアクセスするときに困ります。

SELECT
  department_id,
  AVG(height),
  MAX(height)
FROM
  employee
GROUP BY
  department_id

集計関数を使用した列（AVGとMAXの列）はアクセスするときに、列名がわからないのでどのようにアクセスすればいいのかがわからないためです。

データベースによっては自動的に列名を付与しますが、どのような列名になるのかがわからないので列名を指定してアクセスできません。

仮にheightとアクセスした時にAVGとMAXのどちらの列のことなのかがわかりません。

そのため、集計関数を使用した場合は列名を指定する必要があります。

GROUP BYで複数列を指定する

複数の列を指定した場合は、指定した列すべての値が同一のデータが集約されます。

集計関数で集計して取得するか、それとも集計単位としてGROUP BYに指定するか、臨機応変に使い分けていく必要があります。

古い記事
SQL JOINの結合条件とWHEREの条件の違いと使い分け

新しい記事
SQL DISTINCTで重複行を１行のみ表示する方法

VSCodeからSQL Serverに接続してSQLを実行する
VSCodeからSQL Serverに接続してSQLを実行する方法を紹介します。SQL ServerをDockerで起動して別コンテナからアクセスするで、VSCodeからDockerで起動したSQL ...
SQL ServerをDockerで起動して別コンテナからアクセスする
SQL ServerをDockerで起動して別コンテナからアクセスする方法を紹介します。SQL Serverへの接続はVSCodeで行います。ASP.NET（.NET Core）の開発環境をDocke...
SQL WITH句で同じSQLを１つのSQLに共通化する
SQL SELECT句での副問合せの基本的な考え方と注意点で紹介したように、副問合せを使用していると同じようなSQLを複数箇所で行うことがあります。同じようなSQLはWITH句を使用して共通化すればパ...
SQL 重複しているレコードを一括でUPDATEする
ある列の値が同じレコードが複数ある場合に、そのレコードを全てUPDATEする方法を紹介します。重複しているレコードを１行に集約する方法などはよく見かけますが、重複するレコードを一括でUPDATEします...
SQL テーブルと列（カラム）にコメントを設定する方法
SQLでテーブルと列（カラム）にコメントを設定する方法を紹介します。SQL CREATE文でテーブルを新規作成するで紹介した方法で、テーブルを作成する際に、一緒にコメントを論理名として登録することが多...
SQL SELECT句での副問合せの基本的な考え方と注意点
SELECT句での副問合せをうまく利用すれば、集計単位の異なる値を同時に取得できます。以下のようなテーブルがあるとします。SQL GROUP BYで複数の行を集計して１行で取得するで紹介したように、 ...
SQL SELECT句でテーブルから指定した列のデータを取得する
SELECT句はFROM句で指定されたテーブルから、どの列を取得するかを指定するための構文です。（FROM句についてはでSQL FROM句で複数のテーブルを結合するポイント紹介しています。）以下のよう...
SQL 別テーブルをSELECTした結果が存在すればその値を使用してUPDATEする方法
SQL 別テーブルをSELECTした結果をそのままINSERTする方法でSELECTした結果をそのままINSERTする方法を紹介しましたが、同じようにSELECTした結果がすでに存在していればその値で...
SQL UPDATE文で副問い合わせで取得した値を複数列に設定する方法
UPDATE文で、副問い合わせで取得した値を複数列に設定する方法を紹介します。SETで指定する列を()で囲い、副問い合わせのSQLで()で囲った列に対応するようにSELECTで取得します。SELECT...
SQL 別テーブルをSELECTした結果をそのままINSERTする方法
あるテーブル（A）に登録されているデータを利用して別のテーブル（B）にデータを登録したい場合があります。AをSELECTして、取得したデータを１件ごとBにINSERTするのではなく、AをSELECTし...