ハードディスクメンテナンス ブログ

投稿記事数8,000以上!PC,カメラ,オーディオ,ラジオ,航空,旧ゲームなど

MySQLに於けるGROUP BYでのミス(集約キー以外を書いてしまう)

   

>>高還元のクレジットカード比較 期間限定のキャッシュバックなど!<<


テーブル名:商品一覧
商品名,販売単価,仕入単価
品目A,1000,700
品目B,2000,1400
品目C,3000,2100
品目D,1000,700
品目E,2000,1400
品目F,1000,700

というテーブルがあるとして、ここから、販売価格でGROUP BYする。

SELECT 販売価格,COUNT(*)
FROM 商品一覧
GROUP BY 販売価格

結果は

販売単価,数
1000,3
2000,2
3000,1

となる。

ここで、

SELECT 商品名,販売価格,COUNT(*)
FROM 商品一覧
GROUP BY 販売価格

としてしまうとエラー。

MySQLではエラーとはならずに通ってしまう(※)が、このSQL文に問題があることはすぐに分かる。

商品名,販売単価,数
,1000,3
,2000,2
,3000,1

アは販売単価が1,000円の集合だが、販売単価が1,000円の商品は、品目A、品目D、品目Fの3商品がある。
で、アには、その内のどれを表示すればいいのか?

イは販売単価が2,000円の集合だが、販売単価が2,000円の商品は、品目B、品目Eの2商品がある。
で、イには、その内のどれを表示すればいいのか?

ウは販売単価が3,000円の集合だが、販売単価が3,000円の商品は、品目Cの1商品だけ。
ウには品目Cを表示すれば済むが、その後品目Gが追加され、その販売単価が3,000円だったら?

GROUP化クエリは、GROUP化したそのGROUP毎に1つにまとめてしまうため、その中身を全て表示することはできない。

GROUP BYを使う時、SELECT句に書ける列名は、GROUP BY句で指定した列名(集約キーという)だけである。

MySQLSQLiteでは、エラーとはならず通ってしまう。
では、上記のには何を表示するか、だが、実は、これといった決まりがない。

GROUP BY 部から省略したカラムがグループ内で一定していない場合は、この機能を使用しないでください。
サーバはいかなる値もグループから自由に戻すことができ、すべての値が同じでない限り、結果は不確定です。

11.11.3. 非常時フィールドとの GROUP BY および HAVING

つまり、

商品名,販売単価,数
品目A,1000,3

となることもあれば、

商品名,販売単価,数
品目D,1000,3

となることもあれば、

商品名,販売単価,数
品目F,1000,3

となることもあるということ。

参考:SQLアンチパターン 155ページ 第14章 アンビギュアスグループ(曖昧なグループ)

スポンサーリンク
SQLアンチパターン
Bill Karwin
オライリージャパン
売り上げランキング: 12,496

これは非常に危険であるので、エラーではじいてくれた方がいいかもしれない。

また、問題のないSQL文、

SELECT 販売価格,COUNT(*)
FROM 商品一覧
GROUP BY 販売価格

で得られた結果

販売単価,数
1000,3
2000,2
3000,1

だが、この並び順はランダム。

販売単価,数
3000,1
2000,2
1000,3

となるかもしれないし、

販売単価,数
2000,2
1000,3
3000,1

となるかもしれない。

SQLアンチパターン
Bill Karwin
オライリージャパン
売り上げランキング: 12,496
スポンサーリンク



sha-bc@336×280

sha-bc@336×280


sha-bc@336×280

sha-bc@336×280

  関連記事

no image
CPU対決!激重SQL編!(Phenom X3 8400 vs Core i5 650)

実行時間が70秒近くかかる激重クエリがある。 この実行に於ける、ハードウェアの違 …

ディスク
[GParted] CF-R6のSWAP領域(linux-swap)の拡大操作 [Ubuntu]

SSDに換装したCF-R6だが、メモリーを増設しない場合、512MB(内蔵分)と …

no image
DebianでのGRUBのインストール

update-grub や grub-install をせよと、このブログで書い …

CF-R6
CF-R6は、遅杉且熱杉流!危険杉流「ファンレス」PC

灼熱波動拳並(ふンッ! by 豪鬼 スパIIX)に熱い、パナソニック(旧松下電器 …

no image
ApacheでのURL書換有効化(mod_rewrite,.htaccess,Debian7.4,Apache2.2.22)

(Debian7.4 , Apache2.2.22) http://xxx.xx …

NAS
首都大学東京の学内設置NASが踏み台にされ、スパムメールが送信される事案が発生

約10万通のスパムメール送信。 スパムメールは、15時06分から16時37分の間 …

no image
常時起動サーバーで故障し易い箇所

現在運用しているWEBサーバーやデータベースサーバー、ファイルサーバーは、常時起 …

パームレストの左側が特に熱い
ツイに100度達成!目標はサラに高く! – 熱杉流ノートパソコン、CF-R6

熱杉流状況で非常に危険な、CF-R6。 関連:気温上昇に伴い、CF-R6の温度が …

no image
(Debian7.4)ミラーリングのスペアディスクの追加と自動リビルド(再構築)

ミラーを組んでいるsdaとsdcがある状態で、スペアディスクとしてsdbを追加す …

twitter
Twitterのタイムラインをサイトに埋め込む方法 – コードをユーザー毎に変化させるには?

Twitterのタイムラインをサイトに埋め込むのには、Twitetrにログインし …