『Hacks』の白眉
2004年5月26日リリース。O'REILLYの『Hacks』シリーズの邦訳。最近のO'REILLYの『Hacks』のシリーズと『The Missing Manual』シリーズはどれも見逃せない面白さである。(●^o^●)『Spider』とはインターネットから様々な情報を自動的に取得するプログラムの総称である。ネットの海から欲する情報を吸い出す。それは単にWWWだけでなく、例えば電子メールのPOP3サーバから添付ファイルだけを抜き出す。それら徹底した収集方法を獲得し、次にそれらをRSSを用いてデータを再利用したり、ダッシュボードのウイジットの引っ張るデータとしたりする。(●^o^●)最高にCoolな本である。
特徴として執筆者2名を支える『貢献者』が圧倒的に厚い(熱いとも言える(●^o^●))事が上げられる。それがこの本の中身をすばらしいものにしている!!!『Hacks』の白眉が本書である。
混沌のWEBからデータを収集した人は必読
WEBから特定の情報源を収集して、体系立てて保存したいと考えている人は、必読。本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。
収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。
さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。
そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。
買って損なし。値段以上の価値がある。