2014/11/20(木)CGI(PHP)とCacheやLast-Modified
CGI(PHP)とCacheやLast-Modified
ECO-Wiki (acronia) 設定メモで $lastmod = 1; の設定をしてみましたが、BugTrack/763-負荷対策のまとめ-キャッシュを生かすをみると、これだけではIf-Modified-Sinceの判定などは行われないとのことで、あまり意味がなさそうでした。
そこで、実際に確認してみました。まず、初回アクセス。
[Request] GET /wiki/ HTTP/1.1 Host: eco.acronia.net User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:33.0) Gecko/20100101 Firefox/33.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: ja,en-us;q=0.7,en;q=0.3 Accept-Encoding: gzip, deflate Connection: keep-alive [Response] HTTP/1.1 200 OK Date: Wed, 19 Nov 2014 12:58:24 GMT Server: Apache/2.2.25 Cache-Control: no-cache, max-age=10 Pragma: no-cache Last-Modified: Sat, 15 Nov 2014 14:57:47 GMT Expires: Wed, 19 Nov 2014 12:58:34 GMT Keep-Alive: timeout=5, max=20 Connection: Keep-Alive Transfer-Encoding: chunked Content-Type: text/html; charset=EUC-JP
確かに、Last-Modifiedは出力されています。また、no-cacheも返しているのでPukiWikiとしてはキャッシュして欲しくなさそうです。
そして、2回目のアクセス。
[Request] GET /wiki/ HTTP/1.1 Host: eco.acronia.net User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:33.0) Gecko/20100101 Firefox/33.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: ja,en-us;q=0.7,en;q=0.3 Accept-Encoding: gzip, deflate Connection: keep-alive If-Modified-Since: Sat, 15 Nov 2014 14:57:47 GMT [Response] HTTP/1.1 304 Not Modified Date: Wed, 19 Nov 2014 12:58:02 GMT Server: Apache/2.2.25 Connection: Keep-Alive Keep-Alive: timeout=5, max=17 Expires: Wed, 19 Nov 2014 12:58:12 GMT Cache-Control: no-cache, max-age=10
ブラウザはIf-Modified-Sinceを送っていました。no-cacheは「キャッシュしても良いけど毎回確認してね」くらいの意味合いなので、この挙動自体はまあ普通です。*1
そして、なぜかレスポンスは「304 Not Modified」。つまり、サーバー側でIf-Modified-Sinceを解釈して更新されていないと返答したことになります。しかし、PukiWikiのソースコードを探してもそんなことをしている記述はなさそう、う~ん(ーー;)
そこでもっと調べてみると、どうやらスクリプトがLast-Modifiedを返すと、CGIがIf-Modified-Sinceと比較してNot Modifiedかどうか判断してくれる、らしいです。なにそれΣ('◇'*)
ただ、phpスクリプトはIf-Modified-Sinceなんか見ずに普通に動いている訳なので、
- Not Modifiedでもサーバー側のCPU負荷とかはたぶん通常と同じだけかかる
- データは送られないので、通信量は削減できる
ということになるでしょうか。う~ん、微妙(・・?)
そして、問題なのはPukiWikiのLast-Modifiedは、#pcommentや#include*2を見ていないので、コメントが書き込まれてもキャッシュが更新されずにそれが見えないという現象が起こります(;^_^A
というわけで、$lastmodの設定は元に戻すことにしました。
ちゃんとキャッシュするには?
クライアントキャッシュをちゃんと使うなら、以下の対応が必要でしょうか。
- phpスクリプトでIf-Modified-Sinceを見て、Not Modifiedなら処理をスキップする
- 以下のどちらかの方法で#pcommentや#includeに対応
- Last-Modifiedを調べるときに#pcommentや#includeもたどる
- コメントや被includeファイルを更新したとき、親ファイルの更新日時も変える
#pcommentや#includeもたどるのは、結局ファイルを読む必要があるので負荷を下げたいという目的を考えると微妙です。その点では同時更新が有力ですが、コメントはともかくincludeの対応はちょっと難しいですね。(親ファイルを探す方法を考えないといけない。)
いろいろ手間がかかりそうなのでこれはやらないと思います^^;
PukiWiki bodycache
bodycacheの動作テストをしているのですが、これも更新日時判定の問題で#pcommentや#includeが存在するページは対象外とするようです。ただ、#pcommentについては対策パッチが出ています。(親ファイルの更新日時も変える方式。)
#includeを使っているページは少なくないですが、それ以外のページだけでも負荷が減るなら適用してみても良いかな。