Nutch:Eclipseで動かす
http://www.ubicast.com/tech/nutch/run_nutch_in_eclipse_0.9.html
こちらを参考にしてCrawl.javaを実行してみると、ユーザーインフォメーションがどうのこうのっていうエラーが発生。
で。
http://d.hatena.ne.jp/H_Yamaguchi/20080626/p1
こちらを参考にして、環境変数Pathに
c:\cygwin\bin
を追加。
さらに、Crawl.javaの適当なところに
conf.setInt("io.sort.mb", 30);
こいつを追加。
これで多分動くはず。