メッセージ

2014年11月20日の記事

2014/11/20(木)CGI(PHP)とCacheやLast-Modified

CGI(PHP)とCacheやLast-Modified

ECO-Wiki (acronia) 設定メモで $lastmod = 1; の設定をしてみましたが、BugTrack/763-負荷対策のまとめ-キャッシュを生かすをみると、これだけではIf-Modified-Sinceの判定などは行われないとのことで、あまり意味がなさそうでした。

そこで、実際に確認してみました。まず、初回アクセス。

[Request]
GET /wiki/ HTTP/1.1
Host: eco.acronia.net
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:33.0) Gecko/20100101 Firefox/33.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ja,en-us;q=0.7,en;q=0.3
Accept-Encoding: gzip, deflate
Connection: keep-alive

[Response]
HTTP/1.1 200 OK
Date: Wed, 19 Nov 2014 12:58:24 GMT
Server: Apache/2.2.25
Cache-Control: no-cache, max-age=10
Pragma: no-cache
Last-Modified: Sat, 15 Nov 2014 14:57:47 GMT
Expires: Wed, 19 Nov 2014 12:58:34 GMT
Keep-Alive: timeout=5, max=20
Connection: Keep-Alive
Transfer-Encoding: chunked
Content-Type: text/html; charset=EUC-JP

確かに、Last-Modifiedは出力されています。また、no-cacheも返しているのでPukiWikiとしてはキャッシュして欲しくなさそうです。

そして、2回目のアクセス。

[Request]
GET /wiki/ HTTP/1.1
Host: eco.acronia.net
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:33.0) Gecko/20100101 Firefox/33.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ja,en-us;q=0.7,en;q=0.3
Accept-Encoding: gzip, deflate
Connection: keep-alive
If-Modified-Since: Sat, 15 Nov 2014 14:57:47 GMT

[Response]
HTTP/1.1 304 Not Modified
Date: Wed, 19 Nov 2014 12:58:02 GMT
Server: Apache/2.2.25
Connection: Keep-Alive
Keep-Alive: timeout=5, max=17
Expires: Wed, 19 Nov 2014 12:58:12 GMT
Cache-Control: no-cache, max-age=10

ブラウザはIf-Modified-Sinceを送っていました。no-cacheは「キャッシュしても良いけど毎回確認してね」くらいの意味合いなので、この挙動自体はまあ普通です。*1

そして、なぜかレスポンスは「304 Not Modified」。つまり、サーバー側でIf-Modified-Sinceを解釈して更新されていないと返答したことになります。しかし、PukiWikiのソースコードを探してもそんなことをしている記述はなさそう、う~ん(ーー;)

そこでもっと調べてみると、どうやらスクリプトがLast-Modifiedを返すと、CGIがIf-Modified-Sinceと比較してNot Modifiedかどうか判断してくれる、らしいです。なにそれΣ('◇'*)

ただ、phpスクリプトはIf-Modified-Sinceなんか見ずに普通に動いている訳なので、

  • Not Modifiedでもサーバー側のCPU負荷とかはたぶん通常と同じだけかかる
  • データは送られないので、通信量は削減できる

ということになるでしょうか。う~ん、微妙(・・?)

そして、問題なのはPukiWikiのLast-Modifiedは、#pcommentや#include*2を見ていないので、コメントが書き込まれてもキャッシュが更新されずにそれが見えないという現象が起こります(;^_^A

というわけで、$lastmodの設定は元に戻すことにしました。

ちゃんとキャッシュするには?

クライアントキャッシュをちゃんと使うなら、以下の対応が必要でしょうか。

  • phpスクリプトでIf-Modified-Sinceを見て、Not Modifiedなら処理をスキップする
  • 以下のどちらかの方法で#pcommentや#includeに対応
    • Last-Modifiedを調べるときに#pcommentや#includeもたどる
    • コメントや被includeファイルを更新したとき、親ファイルの更新日時も変える

#pcommentや#includeもたどるのは、結局ファイルを読む必要があるので負荷を下げたいという目的を考えると微妙です。その点では同時更新が有力ですが、コメントはともかくincludeの対応はちょっと難しいですね。(親ファイルを探す方法を考えないといけない。)

いろいろ手間がかかりそうなのでこれはやらないと思います^^;

*1 : もしかしたら、PukiWikiとしては期待していない動作かもしれませんが。

*2 : たぶん、MenuBarもだめ

PukiWiki bodycache

bodycacheの動作テストをしているのですが、これも更新日時判定の問題で#pcommentや#includeが存在するページは対象外とするようです。ただ、#pcommentについては対策パッチが出ています。(親ファイルの更新日時も変える方式。)

#includeを使っているページは少なくないですが、それ以外のページだけでも負荷が減るなら適用してみても良いかな。