WEBから特定の情報源を収集して、体系立てて保存したいと考えている人は、必読。 本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。 さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。 買って損なし。値段以上の価値がある。
スパイダを使用する上での方法論、アルゴリズム、利用方法などが解説されています。 この本では最新のPerl5.8に対応した、また新しいモジュールに対応した内容となっています。今まではオライリーの「Webクライアントプログラミング」という本を参考にスパイダ、ロボットを作っていたが、それを十分上回る内容と情報量です。 オライリーのHackシリーズは通常100種類のHackが解説されているのですが、本書では101あります。この101個目は日本語版での書き下ろしで、Perlを使用した日本語処理に関する基本から応用を解説しています。また、通常翻訳本は英語の内容を日本語にしたものですが、本書はいくつかのHackが日本のWeb環境に合わせて書き直されています。(コードも) 翻訳もすばらしく、日本語環境に合わせているのでそれだけでも5つ星です。
本書は、スパイダ(インターネットから様々な情報を自動的に取得するプログラム)作成時に於ける有益なテクニックを、ふんだんに盛り込んだ、書籍です。 ページをパラパラとめくると、Perlのスクリプトであふれており、中には、sh,Java,PHP,Pythonで記述されたものもあります。とは言っても、第1章「ウォーミングアップ」から始まるので、いきなりスクリプトが登場することはありません。 本書の特筆すべき点に、豪華な執筆陣を挙げることができます。著者は元より、『貢献者』と呼ばれる24人の執筆者の中には、"Sean M.Burke"(著書『Perl&LWP』)や"Paul Bausch"(著書『Amazon Hacks』)を始め、錚錚たるメンバーが名を連ねています。また、多くのHackの末尾には、 執筆者の名前が記されています。『クレジット』のページには、執筆者のプロフィールの他、URLが記載されたものも多く、さらに詳しく調べることができます。
自分がよくチェックするサイトを自動的に巡回したり、お気に入りの画像掲示板から画像を自動で取得するために主にPerlのLWP,HTMLモジュールを中心にスパイダリングを行うツールを作るためのHack本 検索ロボットを作ってみたい、仕組みを知りたい人の導入本としておすすめ。サンプルプログラムを日本国内向けのサイトに変更している点が親切。
インターネットを使いこなす上で絶対必要な検索力、それを磨くには絶対必要な本、と言えるほど充実した内容になっています。Google Hacks を持っている人にも超お勧めの本です。
WEBから特定の情報源を収集して、体系立てて保存したいと考えている人は、必読。
本書は文字列の処理に優れたPerlを中心に記述されているが、WEBアプリケーションに特化したPHPのサンプルが紹介されている。
収集したデータをブログで利用されているRSS(XML)形式にして再公開するための手法も紹介されている。
さらに、スパイダーを運用するに当たっての注意事項などにもページを割いている点は好感。
そして、原著は米国で記述されたものだが、翻訳をする際に日本独自の記述もあり、日本語処理などに戸惑うことは少ないだろう。
買って損なし。値段以上の価値がある。
スパイダを使用する上での方法論、アルゴリズム、利用方法などが解説されています。
この本では最新のPerl5.8に対応した、また新しいモジュールに対応した内容となっています。今まではオライリーの「Webクライアントプログラミング」という本を参考にスパイダ、ロボットを作っていたが、それを十分上回る内容と情報量です。
オライリーのHackシリーズは通常100種類のHackが解説されているのですが、本書では101あります。この101個目は日本語版での書き下ろしで、Perlを使用した日本語処理に関する基本から応用を解説しています。
また、通常翻訳本は英語の内容を日本語にしたものですが、本書はいくつかのHackが日本のWeb環境に合わせて書き直されています。(コードも)
翻訳もすばらしく、日本語環境に合わせているのでそれだけでも5つ星です。
本書は、スパイダ(インターネットから様々な情報を自動的に取得する
プログラム)作成時に於ける有益なテクニックを、ふんだんに盛り込んだ、
書籍です。
ページをパラパラとめくると、Perlのスクリプトであふれており、中には、
sh,Java,PHP,Pythonで記述されたものもあります。とは言っても、
第1章「ウォーミングアップ」から始まるので、いきなりスクリプトが
登場することはありません。
本書の特筆すべき点に、豪華な執筆陣を挙げることができます。
著者は元より、『貢献者』と呼ばれる24人の執筆者の中には、
"Sean M.Burke"(著書『Perl&LWP』)や"Paul Bausch"(著書『Amazon Hacks』)
を始め、錚錚たるメンバーが名を連ねています。また、多くのHackの末尾には、
執筆者の名前が記されています。『クレジット』のページには、執筆者の
プロフィールの他、URLが記載されたものも多く、さらに詳しく調べることが
できます。
自分がよくチェックするサイトを自動的に巡回したり、
お気に入りの画像掲示板から画像を自動で取得するために
主にPerlのLWP,HTMLモジュールを中心にスパイダリングを行うツールを作るためのHack本
検索ロボットを作ってみたい、仕組みを知りたい人の導入本としておすすめ。
サンプルプログラムを日本国内向けのサイトに変更している点が親切。
インターネットを使いこなす上で絶対必要な検索力、それを磨くには絶対必要な本、と言えるほど充実した内容になっています。
Google Hacks を持っている人にも超お勧めの本です。