[MySQL] 日付比較や日付検索が遅いのでBETWEENで改善させる

datetime型の列(reg_time)があるテーブルに対し、年月日指定をかけてデータを取り出す。

注：datetime型の例：2014-01-01 12:34:56

SELECT * FROM `テーブル名` WHERE `reg_time` LIKE ‘2014-01-01%’

これは非常に遅い。

reg_timeにindexを設定しても、indexが使用されないので無意味。

初心者が多用するLIKEなんか使うからだよ！ということで、dateを使うが、

注：dateはdatetime型(2014-01-01 12:34:56)から年月日(2014-01-01)を取り出す関数。

SELECT * FROM `テーブル名` WHERE date(`reg_time`) = ‘2014-01-01’

これも同様に遅い(indexも使用されない)。

この解決方法は、BETWEENを使用することである。

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘2014-01-01 00:00:00’ AND ‘2014-01-01 23:59:59’

これにより、高速化が可能。

EXPLAINで動作を見ると、typeがallからrangeになっていることが分かる。

typeは、テーブルに対してどのような方法でアクセスするのかを示すもの。

allはフルテーブルスキャンで、インデックスが全く使用されていないことを表す、最悪なモノだ。

一方rangeは、インデックスを用いた範囲検索である。

2014年1月1日の始端(00:00:00)と終端(23:59:59)を設定し、その間(BETWEEN)とすれば、同じものがSELECTでき、強引にBETWEEN化できるのは分かる。

まぁ、これはそれでよいとして、年月指定(日がない)の場合はどうか。

月毎の集計とかね。

当然、

SELECT * FROM `テーブル名` WHERE `reg_time` LIKE ‘2014-01-%’

は遅く、同様に

SELECT * FROM `テーブル名` WHERE LEFT(`reg_time`,’7′) = ‘2014-01’

や

SELECT * FROM `テーブル名` WHERE LEFT(`reg_time`,’8′) = ‘2014-01-‘

注：LEFT(`reg_time`,’7′)は、reg_timeの左から7文字を取り出す、つまり年-月を取得する関数。

も遅い。

となると、高速化が考えられるのはBETWEENとなるが、時刻の場合は終端が23:59:59で決まるが、月日の場合の終端日はどうするか？

終端日は、月によって異なるだろう？

まぁ、ダメだと思って

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘2014-01-01 00:00:00’ AND ‘2014-01-32 23:59:59′

とすると…

エラーにはならないが、返された結果が0となり、不可ｗｗｗｗｗ

32日は存在しない日だからだろう。

となると、その月の最終日(月末日,晦日)を求めなければならない。

PHPであれば、

cal_days_in_month(CAL_GREGORIAN,$month,$year)

という関数がある(年と月の順序に注意)。

これは月末を求める関数ではなく、その年月の日数($hikazu)を求めるものだ。

日数が分かるということは、最終日($last_day)は

$hikazu = cal_days_in_month(CAL_GREGORIAN,$month,$year) ;

$last_day = $year.”-“.sprintf(“%02d”,$month).”-“.sprintf(“%02d”,$hikazu) ;

として求められるので、

$from = $year.”-“.sprintf(“%02d”,$month).”-01 00:00:00″ ;

$to = $last_day.” 23:59:59″ ;

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘$from’ AND ‘$to’

とすればよい。

また、MySQLの日付/時刻関数にlast_dayというものがある。

これは、与えた年月日の月末(年月日)を返す。

last_day(‘2014-01-01’) → 2014-01-31

これを使うと、

$from = $year.”-“.sprintf(“%02d”,$month).”-01″ ;

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN CONCAT(‘$from’,’ 00:00:00′) AND CONCAT(last_day(‘$from’),’ 23:59:59′)

とすることができる。

BETWEENを使うと高速化できるのは分かるが、コードが長くなるし、直感的でもないし、スマートじゃないね…

—–

`reg_time`にはミリ秒は格納されていないので、23:59:59.x秒が範囲外になることはない。

—–

BETWEEN ‘2014-01-01’ AND ‘2014-01-01’ + interval 1 day ;

とすると短く書けるように思えるが、これは 2014-01-02 00:00:00 を含むので、厳密には不適。

実際に試してみる。

以下のようなテーブルがあり、カラム(reg_time)に以下が格納されている。

2014-01-01 23:59:59
2014-01-02 00:00:00
2014-01-02 00:00:01
2014-01-02 00:00:02

これに対し、

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘2014-01-01 00:00:00’ AND ‘2014-01-01 23:59:59’ ;

を投げると、結果は

2014-01-01 23:59:59

の1件が返されるが、

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘2014-01-01’ AND ‘2014-01-01’ + INTERVAL 1 day ;

を投げると、結果は

2014-01-01 23:59:59
2014-01-02 00:00:00

となり、2件返されてしまう。

+ INTERVAL 1 dayでは、

2014-01-02 00:00:00(翌日の00:00:00)

が含まれてしまうのでアウト。

データに「00:00:00」が記録されているかはその記録頻度にも寄るが、開発時点で含まれていなければ「問題ナシッ！」てコトで通ってしまいかねない(笑)

で、運用開始後、「00:00:00」が記録され、一致せずに「オカシーナー♪」となる。

なら、

SELECT * FROM `テーブル名` WHERE `reg_time` BETWEEN ‘2014-01-01’ AND ‘2014-01-01’ + INTERVAL 1 day – INTERVAL 1 SECOND ;

と書けばどうなるのかはシラン(SILANE)。

MySQL全機能バイブル ~現場で役立つAtoZ~

posted on shattered-blog.com at 14.06.01

鈴木啓修
技術評論社
売り上げランキング: 199,175

Amazon.co.jpで詳細を見る

実践ハイパフォーマンスMySQL 第3版

posted on shattered-blog.com at 14.03.03

Baron Schwartz Peter Zaitsev Vadim Tkachenko
オライリージャパン
売り上げランキング: 56,487

Amazon.co.jpで詳細を見る