Warning
2016年5月28日追記:現在は稼働してません。
このサイトのSEO用にHTMLをプリレンダーするサーバーのPhantomJSのメモリ消費が大きくて気になったのでherokuの方に構築してみた。
$ curl http://seo-endaaman-me.herokuapp.com/http://endaaman.me/memo
と
$ curl http://endaaman.me/memo
でAjax取得できれたデータがHTML上に反映されているのが分かると思う。単純にパス以降のURLをPhantomJSで開いてHTMLをレンダリングしてるだけだけど。前に作ったspaseo.jsはハンドラーだけの提供を目指した結果見事なまでのコールバック地獄に陥ったので、その反省を活かしていつものkoaにしたらかなりスッキリかけた。あとでhostに/^endaaman\.me$/
でホワイトリストかけてるので、関係ないサイトはレンダーできないです。forkして自分でherokuに乗っけてください。
リポジトリ: endaaman/seo-endaaman-me。
あとはnginxだったらconfにUserAgentとか_escaped_fragment_
をチェックした中に
location / {
index /index.html;
try_files $uri @fallback;
expires off;
}
location @fallback {
set $prerender 0;
if ($http_user_agent ~* "googlebot|twitter|facebook|yahoo!|bingbot|msnbot|y!j|hatena|ssk|naverbot") {
set $prerender 1;
}
if ($args ~ "_escaped_fragment_") {
set $prerender 1;
}
if ($uri ~ "\.(js|css|xml|less|png|jpg|jpeg|gif|pdf|doc|txt|ico|rss|zip|mp3|rar|exe|wmv|doc|avi|ppt|mpg|mpeg|tif|wav|mov|psd|ai|xls|mp4|m4a|swf|dat|dmg|iso|flv|m4v|torrent|ttf|woff)") {
set $prerender 0;
}
resolver 8.8.8.8;
set $protocol 'http://';
if ($https) {
set $protocol 'https://';
}
# これはデバッグ用
set $prerender_host '127.0.0.1:3001';
if ($host = 'endaaman.me') {
set $prerender_host 'seo-endaaman-me.herokuapp.com';
}
if ($prerender = 1) {
rewrite .* /$protocol$host$request_uri? break;
proxy_pass http://$prerender_host;
}
if ($prerender = 0) {
rewrite .* /index.html break;
}
}
みたいに http://target_host/path/to/content
を GET http://seo-endaaman-me.herokuapp.com/http://target_host/path/to/content
って感じ書き換えるようにすれば、Googleさんが相手してくれるようになるはず。
今更になって初めてheroku使ったけど悪いことたくさんできそうで楽しいね。